HyperAIHyperAI
vor 16 Tagen

AtLoc: Aufmerksamkeitsgesteuerte Kamerapositionsermittlung

Bing Wang, Changhao Chen, Chris Xiaoxuan Lu, Peijun Zhao, Niki Trigoni, Andrew Markham
AtLoc: Aufmerksamkeitsgesteuerte Kamerapositionsermittlung
Abstract

Deep Learning hat beeindruckende Ergebnisse bei der Kamerapositionsschätzung erzielt, doch derzeitige Verfahren auf Basis einzelner Bilder leiden häufig an mangelnder Robustheit, was zu starken Ausreißern führt. In gewissem Maße wurde dieses Problem durch sequenzielle (mehrbildbasierte) oder geometrische Einschränkungsansätze angegangen, die lernen, dynamische Objekte und Lichtbedingungen zu ignorieren, um eine verbesserte Leistung zu erzielen. In dieser Arbeit zeigen wir, dass Aufmerksamkeit genutzt werden kann, um das Netzwerk dazu zu zwingen, sich auf geometrisch robusteren Objekten und Merkmalen zu konzentrieren, wodurch eine state-of-the-art-Leistung auf gängigen Benchmark-Datenbanken erreicht wird – selbst wenn nur ein einzelnes Bild als Eingabe verwendet wird. Ausführliche experimentelle Ergebnisse werden anhand öffentlicher Innen- und Außenbereichs-Datensätze vorgestellt. Durch die Visualisierung von Aufmerksamkeitskarten (Saliency Maps) demonstrieren wir, wie das Netzwerk lernt, dynamische Objekte zu verwerfen, was eine herausragende Leistung bei der globalen Schätzung der Kamerapose ermöglicht. Der Quellcode ist unter https://github.com/BingCS/AtLoc verfügbar.