HyperAIHyperAI

Command Palette

Search for a command to run...

OpenStreetView-5M: Die Vielfalt der Wege zur globalen visuellen Geolokalisierung

Guillaume Astruc; Nicolas Dufour; Ioannis Siglidis; Constantin Aronssohn; Nacim Bouia; Stephanie Fu; Romain Loiseau; Van Nguyen Nguyen; Charles Raude; Elliot Vincent; Lintao XU; Hongyu Zhou; Loic Landrieu

Zusammenfassung

Die Bestimmung des Standorts eines Bildes überall auf der Erde ist eine komplexe visuelle Aufgabe, die sie besonders relevant für die Bewertung von Computer-Vision-Algorithmen macht. Dennoch hat das Fehlen standardisierter, groß angelegter und öffentlich zugänglicher Datensätze mit zuverlässig lokalisierbaren Bildern ihr Potenzial eingeschränkt. Um dieses Problem anzugehen, stellen wir OpenStreetView-5M vor, einen groß angelegten, öffentlich zugänglichen Datensatz, der über 5,1 Millionen georeferenzierte Straßensichtbilder umfasst und 225 Länder und Gebiete abdeckt. Im Gegensatz zu bestehenden Benchmarks legen wir eine strenge Trennung zwischen Trainings- und Testdaten fest, was es uns ermöglicht, die Relevanz gelernter geografischer Merkmale über reine Memorierung hinaus zu bewerten. Um die Nützlichkeit unseres Datensatzes zu demonstrieren, führen wir eine umfangreiche Benchmark-Analyse verschiedener standortbestimmender Bildencoder (image encoders), räumlicher Darstellungen (spatial representations) und Trainingsstrategien durch. Alle zugehörigen Codes und Modelle sind unter https://github.com/gastruc/osv5m zu finden.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp