SpaGBOL: Raum-Graph-basierte Orientierungslokalisierung

Die Cross-View Geo-Lokalisierung in städtischen Regionen ist teilweise aufgrund des Mangels an geo-räumlicher Strukturierung in aktuellen Datensätzen und Techniken herausfordernd. Wir schlagen vor, Graphrepräsentationen zu nutzen, um Sequenzen lokaler Beobachtungen und die Verbindlichkeit des Zielorts zu modellieren. Das Modellieren als Graph ermöglicht es, bisher nicht gesehene Sequenzen durch das Sampling mit neuen Parameterkonfigurationen zu generieren. Um diese neu verfügbaren Informationen optimal zu nutzen, schlagen wir eine architektur basierend auf Graph Neural Networks (GNN) vor, die räumlich starke Einbettungen erzeugt und die Unterscheidbarkeit von isolierten Bild-Einbettungen verbessert. Wir beschreiben SpaGBOL und führen drei neue Beiträge ein: 1) Den ersten graphstrukturierten Datensatz für Cross-View Geo-Lokalisierung, der mehrere Streetview-Bilder pro Knoten enthält, um die Generalisierungsfähigkeit zu erhöhen.2) Die Einführung von GNNs in das Problembereich, wobei wir das erste System entwickeln, das die Korrelation zwischen Knotennähe und Merkmalsähnlichkeit ausnutzt.3) Durch den Einsatz der einzigartigen Eigenschaften der Graphrepräsentation – wir demonstrieren einen neuen Ansatz zur Retrieval-Filterung basierend auf Nachbarschaftsbearings.SpaGBOL erreicht Stand-of-the-Art-Genauigkeiten im unbekannten Testgraph – mit relativen Verbesserungen der Top-1-Retrievalgenauigkeit gegenüber früheren Techniken um 11 % und 50 % bei der Filterung mit Bearing Vector Matching im SpaGBOL-Datensatz.