HyperAIHyperAI
vor 2 Monaten

IM2GPS im Zeitalter des Deep Learnings erneut betrachtet

Nam Vo; Nathan Jacobs; James Hays
IM2GPS im Zeitalter des Deep Learnings erneut betrachtet
Abstract

Die Geolokalisierung von Bildern, also die Ermittlung der geografischen Position eines Bildes, stellt ein anspruchsvolles Problem der Computer Vision dar und hat zahlreiche potenzielle Anwendungen. Der aktuellste Stand der Technik zur Lösung dieses Problems ist ein tiefes Bildklassifizierungsverfahren, bei dem die Welt räumlich in Zellen unterteilt wird und ein tiefes Netzwerk trainiert wird, um für ein gegebenes Bild die korrekte Zelle vorherzusagen. Wir schlagen vor, dieses Verfahren mit dem ursprünglichen Im2GPS-Verfahren zu kombinieren, bei dem ein Abfragebild anhand einer Datenbank von geotaggten Bildern abgeglichen wird und die Position aus der zurückgegebenen Menge abgeleitet wird. Um die geografische Position eines Abfragebilds zu schätzen, wenden wir eine Kerndichteschätzung auf die Orte seiner nächsten Nachbarn in der Referenzdatenbank an. Interessanterweise stellen wir fest, dass die besten Merkmale für unsere Retrieval-Aufgabe von Netzwerken stammen, die mit einem Klassifikationsverlust trainiert wurden, obwohl wir bei der Testzeit kein Klassifikationsverfahren verwenden. Das Training mit Klassifikationsverlust übertrifft mehrere Methoden des tiefen Merkmalslernens (z.B. Siamese Netze mit kontrastivem oder triplet loss), die eher für Retrieval-Anwendungen typisch sind. Unser einfaches Verfahren erreicht den aktuellen Stand der Technik in Bezug auf Geolokalisierungsgenauigkeit und benötigt gleichzeitig erheblich weniger Trainingsdaten.

IM2GPS im Zeitalter des Deep Learnings erneut betrachtet | Neueste Forschungsarbeiten | HyperAI