HyperAIHyperAI
vor 2 Monaten

OpenStreetView-5M: Die Vielfalt der Wege zur globalen visuellen Geolokalisierung

Guillaume Astruc; Nicolas Dufour; Ioannis Siglidis; Constantin Aronssohn; Nacim Bouia; Stephanie Fu; Romain Loiseau; Van Nguyen Nguyen; Charles Raude; Elliot Vincent; Lintao XU; Hongyu Zhou; Loic Landrieu
OpenStreetView-5M: Die Vielfalt der Wege zur globalen visuellen Geolokalisierung
Abstract

Die Bestimmung des Standorts eines Bildes überall auf der Erde ist eine komplexe visuelle Aufgabe, die sie besonders relevant für die Bewertung von Computer-Vision-Algorithmen macht. Dennoch hat das Fehlen standardisierter, groß angelegter und öffentlich zugänglicher Datensätze mit zuverlässig lokalisierbaren Bildern ihr Potenzial eingeschränkt. Um dieses Problem anzugehen, stellen wir OpenStreetView-5M vor, einen groß angelegten, öffentlich zugänglichen Datensatz, der über 5,1 Millionen georeferenzierte Straßensichtbilder umfasst und 225 Länder und Gebiete abdeckt. Im Gegensatz zu bestehenden Benchmarks legen wir eine strenge Trennung zwischen Trainings- und Testdaten fest, was es uns ermöglicht, die Relevanz gelernter geografischer Merkmale über reine Memorierung hinaus zu bewerten. Um die Nützlichkeit unseres Datensatzes zu demonstrieren, führen wir eine umfangreiche Benchmark-Analyse verschiedener standortbestimmender Bildencoder (image encoders), räumlicher Darstellungen (spatial representations) und Trainingsstrategien durch. Alle zugehörigen Codes und Modelle sind unter https://github.com/gastruc/osv5m zu finden.

OpenStreetView-5M: Die Vielfalt der Wege zur globalen visuellen Geolokalisierung | Neueste Forschungsarbeiten | HyperAI