HyperAIHyperAI

Command Palette

Search for a command to run...

AtLoc: Aufmerksamkeitsgesteuerte Kamerapositionsermittlung

Bing Wang Changhao Chen Chris Xiaoxuan Lu Peijun Zhao Niki Trigoni Andrew Markham

Zusammenfassung

Deep Learning hat beeindruckende Ergebnisse bei der Kamerapositionsschätzung erzielt, doch derzeitige Verfahren auf Basis einzelner Bilder leiden häufig an mangelnder Robustheit, was zu starken Ausreißern führt. In gewissem Maße wurde dieses Problem durch sequenzielle (mehrbildbasierte) oder geometrische Einschränkungsansätze angegangen, die lernen, dynamische Objekte und Lichtbedingungen zu ignorieren, um eine verbesserte Leistung zu erzielen. In dieser Arbeit zeigen wir, dass Aufmerksamkeit genutzt werden kann, um das Netzwerk dazu zu zwingen, sich auf geometrisch robusteren Objekten und Merkmalen zu konzentrieren, wodurch eine state-of-the-art-Leistung auf gängigen Benchmark-Datenbanken erreicht wird – selbst wenn nur ein einzelnes Bild als Eingabe verwendet wird. Ausführliche experimentelle Ergebnisse werden anhand öffentlicher Innen- und Außenbereichs-Datensätze vorgestellt. Durch die Visualisierung von Aufmerksamkeitskarten (Saliency Maps) demonstrieren wir, wie das Netzwerk lernt, dynamische Objekte zu verwerfen, was eine herausragende Leistung bei der globalen Schätzung der Kamerapose ermöglicht. Der Quellcode ist unter https://github.com/BingCS/AtLoc verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
AtLoc: Aufmerksamkeitsgesteuerte Kamerapositionsermittlung | Paper | HyperAI