HyperAIHyperAI
vor 12 Tagen

Ein neuartiges geo-lokalisierendes Verfahren für UAV- und Satellitenbilder unter Verwendung von cross-view-konsistentem Attention

{Y Zhang, H Li, Y Li, Z Zhang, X Wang, P Zhou, Z Cui}
Abstract

Die Geo-Lokalisierung ist weit verbreitet als wichtige Technik zur Bestimmung von Länge und Breite für die Navigation von unbemannten Luftfahrzeugen (UAVs) im Außenflug eingesetzt. Aufgrund der möglichen Störung und Blockierung von GPS-Signalen hat in den letzten Jahren die auf Bildretrieval basierende Methode, die weniger anfällig für Störungen ist, erhebliche Aufmerksamkeit erhalten. Die Geo-Lokalisierung von UAVs und Satelliten kann durch die Abfrage vorab erhaltener, GPS-getagter Satellitenbilder mit Drohnenbildern aus unterschiedlichen Perspektiven erreicht werden. In diesem Artikel wird eine Bildtransformationstechnik eingesetzt, um informationsreiche, kreuzperspektivische Geo-Lokalisierungsinformationen zwischen UAVs und Satelliten zu extrahieren. Zunächst wird ein einstufiges Trainingsverfahren für die Geo-Lokalisierung von UAVs und Satelliten vorgestellt, das gleichzeitig die Kreuzperspektiven-Feature-Extraktion und das Bildretrieval realisiert und eine höhere Genauigkeit als bestehende mehrstufige Trainingsansätze erzielt. Des Weiteren wird eine neuartige stückweise Soft-Margin-Triplet-Verlustfunktion entworfen, um zu verhindern, dass die Modellparameter in suboptimale Lösungsmengen geraten, die durch die fehlende Einschränkung von positiven und negativen Beispielen verursacht werden können. Die Ergebnisse zeigen, dass die vorgeschlagene Verlustfunktion die Genauigkeit des Bildretrievals verbessert und eine bessere Konvergenz ermöglicht. Zudem wird eine Daten-Augmentierungsmethode für Satellitenbilder vorgeschlagen, um die ungleichmäßige Verteilung der Bildproben zu überwinden. Auf der Benchmark University-1652 erreicht die vorgeschlagene Methode den Stand der Technik mit einer Verbesserung der Recall-Rate (R@1) um 6,67 % und einer Steigerung der durchschnittlichen Präzision (AP) um 6,13 %. Alle Quellcodes werden öffentlich verfügbar gemacht, um die Reproduzierbarkeit zu fördern.

Ein neuartiges geo-lokalisierendes Verfahren für UAV- und Satellitenbilder unter Verwendung von cross-view-konsistentem Attention | Neueste Forschungsarbeiten | HyperAI