HyperAIHyperAI
vor 11 Tagen

Occlusion-robuste Objektpose-Schätzung mit einer integrierten Darstellung

Bo Chen, Tat-Jun Chin, Marius Klimavicius
Occlusion-robuste Objektpose-Schätzung mit einer integrierten Darstellung
Abstract

Die praktische Objektpose-Schätzung erfordert Robustheit gegenüber Verdeckungen des Zielobjekts. Moderne State-of-the-Art (SOTA)-Pose-Schätzer verfolgen einen zweistufigen Ansatz: Im ersten Schritt schätzt ein tiefes Netzwerk 2D-Landmarken, und im zweiten Schritt wird die 6-DOF-Pose aus 2D-3D-Zuordnungen berechnet. Obwohl dieser zweistufige Ansatz weit verbreitet ist, können solche Methoden bei der Generalisierung unter neuen Verdeckungen leiden und unter schwacher Landmarken-Kohärenz leiden, verursacht durch gestörte Merkmale. Um diese Probleme zu lösen, entwickeln wir eine neuartige Batch-Augmentationstechnik namens „Occlude-and-Blackout“, die tiefere Merkmale lernbar macht, die robust gegenüber Verdeckungen sind. Zudem stellen wir eine Architektur mit mehrstufiger Präzisionsüberwachung vor, die eine umfassende Lernung der Pose-Repräsentation fördert und somit genaue und konsistente Landmarkenvorhersagen ermöglicht. Wir führen sorgfältige Ablationsstudien durch, um den Einfluss unserer Innovationen zu überprüfen, und vergleichen unsere Methode mit anderen SOTA-Pose-Schätzern. Ohne jegliche Nachbearbeitung oder Verfeinerung erzielt unsere Methode eine überlegene Leistung auf dem LINEMOD-Datensatz. Auf dem YCB-Video-Datensatz übertrifft unsere Methode alle Methoden ohne Verfeinerung hinsichtlich des ADD(-S)-Metriks. Außerdem zeigen wir die hohe Dateneffizienz unserer Methode. Der Quellcode ist unter http://github.com/BoChenYS/ROPE verfügbar.