HyperAIHyperAI

Command Palette

Search for a command to run...

Occlusion-robuste Objektpose-Schätzung mit einer integrierten Darstellung

Bo Chen Tat-Jun Chin Marius Klimavicius

Zusammenfassung

Die praktische Objektpose-Schätzung erfordert Robustheit gegenüber Verdeckungen des Zielobjekts. Moderne State-of-the-Art (SOTA)-Pose-Schätzer verfolgen einen zweistufigen Ansatz: Im ersten Schritt schätzt ein tiefes Netzwerk 2D-Landmarken, und im zweiten Schritt wird die 6-DOF-Pose aus 2D-3D-Zuordnungen berechnet. Obwohl dieser zweistufige Ansatz weit verbreitet ist, können solche Methoden bei der Generalisierung unter neuen Verdeckungen leiden und unter schwacher Landmarken-Kohärenz leiden, verursacht durch gestörte Merkmale. Um diese Probleme zu lösen, entwickeln wir eine neuartige Batch-Augmentationstechnik namens „Occlude-and-Blackout“, die tiefere Merkmale lernbar macht, die robust gegenüber Verdeckungen sind. Zudem stellen wir eine Architektur mit mehrstufiger Präzisionsüberwachung vor, die eine umfassende Lernung der Pose-Repräsentation fördert und somit genaue und konsistente Landmarkenvorhersagen ermöglicht. Wir führen sorgfältige Ablationsstudien durch, um den Einfluss unserer Innovationen zu überprüfen, und vergleichen unsere Methode mit anderen SOTA-Pose-Schätzern. Ohne jegliche Nachbearbeitung oder Verfeinerung erzielt unsere Methode eine überlegene Leistung auf dem LINEMOD-Datensatz. Auf dem YCB-Video-Datensatz übertrifft unsere Methode alle Methoden ohne Verfeinerung hinsichtlich des ADD(-S)-Metriks. Außerdem zeigen wir die hohe Dateneffizienz unserer Methode. Der Quellcode ist unter http://github.com/BoChenYS/ROPE verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Occlusion-robuste Objektpose-Schätzung mit einer integrierten Darstellung | Paper | HyperAI