HyperAIHyperAI
vor 18 Tagen

GSV-Cities: Hin zum angemessenen überwachten visuellen Ortserkennung

Amar Ali-bey, Brahim Chaib-draa, Philippe Giguère
GSV-Cities: Hin zum angemessenen überwachten visuellen Ortserkennung
Abstract

Diese Arbeit zielt darauf ab, die Repräsentationslernung für große Skalen visueller Ortserkennung zu untersuchen, wobei es darum geht, die in einer Abfrageabbildung dargestellte Position anhand einer Datenbank von Referenzbildern zu bestimmen. Dies stellt eine herausfordernde Aufgabe dar, da über die Zeit erhebliche Umweltveränderungen auftreten können (z. B. Wetter, Beleuchtung, Jahreszeit, Verkehr, Verdeckung). Der Fortschritt wird derzeit durch den Mangel an großen Datenbanken mit präzisen Referenzwerten behindert. Um diese Herausforderung zu bewältigen, stellen wir GSV-Cities vor, eine neue Bild-Datenbank mit bisher größter geografischer Abdeckung und hochpräzisen Referenzwerten, die mehr als 40 Städte auf allen Kontinenten über einen Zeitraum von 14 Jahren erfasst. Anschließend erforschen wir das volle Potenzial neuer Entwicklungen im Bereich des tiefen metrischen Lernens, um Netzwerke speziell für die Ortserkennung zu trainieren, und bewerten, wie verschiedene Verlustfunktionen die Leistung beeinflussen. Zudem zeigen wir, dass die Leistung bestehender Methoden erheblich steigt, wenn sie auf GSV-Cities trainiert werden. Schließlich führen wir eine neue vollständig konvolutionale Aggregationsschicht ein, die bestehende Techniken – einschließlich GeM, NetVLAD und CosPlace – übertrifft, und etablieren eine neue State-of-the-Art-Leistung auf großen Skalen-Benchmarks wie Pittsburgh, Mapillary-SLS, SPED und Nordland. Die Datenbank und der zugehörige Code sind für Forschungszwecke unter https://github.com/amaralibey/gsv-cities verfügbar.