HyperAIHyperAI

Command Palette

Search for a command to run...

Um die Welt in 80 Zeitschritten: Ein generativer Ansatz zur globalen visuellen Geolokalisierung

Nicolas Dufour David Picard Vicky Kalogeiton Loic Landrieu

Zusammenfassung

Globale visuelle Geolokalisierung prognostiziert, wo ein Bild auf der Erde aufgenommen wurde. Da Bilder unterschiedlich präzise lokalisiert werden können, beinhaltet diese Aufgabe von Natur aus einen erheblichen Grad an Ambiguität. Bestehende Ansätze sind jedoch deterministisch und ignorieren diesen Aspekt. In dieser Arbeit streben wir an, die Lücke zwischen traditioneller Geolokalisierung und modernen generativen Methoden zu schließen. Wir schlagen den ersten generativen Geolokalisierungsansatz vor, der auf Diffusion und riemannschem Flussabgleich basiert, wobei der Entrauschkungsprozess direkt auf der Oberfläche der Erde stattfindet. Unser Modell erreicht den Stand der Technik in drei Benchmarks für visuelle Geolokalisierung: OpenStreetView-5M, YFCC-100M und iNat21. Zudem führen wir die Aufgabe der probabilistischen visuellen Geolokalisierung ein, bei der das Modell eine Wahrscheinlichkeitsverteilung über alle möglichen Orte anstelle eines einzelnen Punktes vorhersagt. Wir stellen neue Metriken und Baselines für diese Aufgabe vor und zeigen die Vorteile unseres diffusionsbasierten Ansatzes auf. Die Codes und Modelle werden zur Verfügung gestellt.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Um die Welt in 80 Zeitschritten: Ein generativer Ansatz zur globalen visuellen Geolokalisierung | Paper | HyperAI