HyperAIHyperAI
vor 2 Monaten

BEV-CV: Birds-Eye-View-Transformation für die Geo-Lokalisierung bei unterschiedlichen Ansichten

Shore, Tavis ; Hadfield, Simon ; Mendez, Oscar
BEV-CV: Birds-Eye-View-Transformation für die Geo-Lokalisierung bei unterschiedlichen Ansichten
Abstract

Die Bildübereinstimmung zwischen verschiedenen Ansichten für die Geo-Lokalisierung ist ein anspruchsvolles Problem aufgrund der erheblichen visuellen Unterschiede zwischen Luftbildern und Bodenansichten. Die Methode ermöglicht es, Lokalisierungsfähigkeiten aus georeferenzierten Bildern zu gewinnen, wodurch die Notwendigkeit externer Geräte oder kostenintensiver Ausrüstungen entfällt. Dies erhöht die Fähigkeit von Agenten, ihre Position autonom zu bestimmen, sich zu navigieren und effektiv in Umgebungen ohne GNSS (Global Navigation Satellite System) zu operieren. Aktuelle Forschungsansätze verwenden eine Vielzahl von Techniken zur Verringerung des Domänenunterschieds, wie z.B. die Anwendung von Polarkoordinatentransformationen auf Luftbilder oder die Synthese zwischen Perspektiven. Diese Ansätze basieren jedoch in der Regel auf einem 360°-Sichtfeld, was ihre praktische Anwendbarkeit einschränkt.Wir schlagen BEV-CV vor, einen Ansatz, der zwei wesentliche Neuerungen einführt, um die praktische Anwendbarkeit der cross-view Geo-Lokalisierung zu verbessern. Erstens wird das semantische Vogelperspektivbild (Birds-Eye-View) von Bodenansichten erstellt, bevor die Einbettungen übereingestimmt werden, was eine direkte Vergleichbarkeit mit den Darstellungen von Luftbildern ermöglicht. Zweitens passen wir Datensätze in ein anwendungsnahes Format an – Bilder mit begrenztem Sichtfeld (Field-of-View), die der Fahrtrichtung des Fahrzeugs angepasst sind.BEV-CV erreicht Stand-of-the-Art-Rückrufgenauigkeiten und verbessert die Top-1-Raten von 70°-Ausschnitten aus CVUSA und CVACT um 23 % und 24 % jeweils. Zudem verringert es die Rechenanforderungen durch Reduzierung der Gleitkommaoperationen unter den bisherigen Werten und senkt die Dimensionalität der Einbettungen um 33 %. Diese Verbesserungen ermöglichen zusammen eine schnellere Lokalisierungsfähigkeit.

BEV-CV: Birds-Eye-View-Transformation für die Geo-Lokalisierung bei unterschiedlichen Ansichten | Neueste Forschungsarbeiten | HyperAI