HyperAIHyperAI
vor 11 Tagen

RePOSE: Schnelle 6D-Objektpose-Verfeinerung mittels Tiefer Textur-Rendering

Shun Iwase, Xingyu Liu, Rawal Khirodkar, Rio Yokota, Kris M. Kitani
RePOSE: Schnelle 6D-Objektpose-Verfeinerung mittels Tiefer Textur-Rendering
Abstract

Wir präsentieren RePOSE, eine schnelle iterative Verfeinerungsmethode für die 6D-Objektpose-Schätzung. Vorherige Ansätze führen die Verfeinerung durch, indem sie vergrößerte Eingabebilder und gerenderte RGB-Bilder in ein CNN einfließen lassen und direkt eine Aktualisierung der verfeinerten Pose regressieren. Ihre Laufzeit ist aufgrund der hohen Rechenkosten des CNN langsam, was sich besonders bei der Verfeinerung mehrerer Objekte stark auswirkt. Um dieses Problem zu überwinden, nutzt RePOSE die Bildrenderung zur schnellen Merkmalsextraktion mithilfe eines 3D-Modells mit lernbarer Textur. Wir bezeichnen dies als tiefes Textur-Rendering, bei dem ein flaches mehrschichtiges Perzeptron direkt eine ansichts-invariante Bildrepräsentation eines Objekts regressiert. Darüber hinaus verwenden wir eine differenzierbare Levenberg-Marquardt-(LM)-Optimierung, um die Pose schnell und genau zu verfeinern, indem der Merkmals-Metrik-Fehler zwischen der Eingabe- und der gerenderten Bildrepräsentation minimiert wird, ohne dass eine Vergrößerung der Eingabe erforderlich ist. Diese Bildrepräsentationen werden so trainiert, dass die differenzierbare LM-Optimierung innerhalb weniger Iterationen konvergiert. Dadurch erreicht RePOSE eine Geschwindigkeit von 92 FPS und erzielt eine state-of-the-art-Genauigkeit von 51,6 % auf dem Occlusion LineMOD-Datensatz – eine absolute Verbesserung von 4,1 % gegenüber der vorherigen Forschung – sowie vergleichbare Ergebnisse auf dem YCB-Video-Datensatz bei deutlich schnellerer Laufzeit. Der Quellcode ist unter https://github.com/sh8/repose verfügbar.

RePOSE: Schnelle 6D-Objektpose-Verfeinerung mittels Tiefer Textur-Rendering | Neueste Forschungsarbeiten | HyperAI