HybridPose: 6D-Objektpose-Schätzung unter hybriden Darstellungen

Wir stellen HybridPose vor, einen neuartigen Ansatz zur Schätzung der 6D-Objektpose. HybridPose nutzt eine hybride Zwischendarstellung, um unterschiedliche geometrische Informationen in dem Eingabebild auszudrücken, darunter Keypoints, Kantenvektoren sowie Symmetriekorrespondenzen. Im Vergleich zu einer einheitlichen Darstellung ermöglicht unsere hybride Darstellung, dass die Pose-Regression mehr und vielfältigere Merkmale ausnutzen kann, wenn eine bestimmte Art der vorhergesagten Darstellung ungenau ist (z. B. aufgrund von Verdeckung). Alle von HybridPose verwendeten Zwischendarstellungen können von derselben einfachen neuronalen Netzwerkarchitektur vorhergesagt werden, und Ausreißer in den vorhergesagten Zwischendarstellungen werden durch ein robusteres Regressionsmodul gefiltert. Im Vergleich zu aktuellen state-of-the-art-Verfahren für die Pose-Schätzung ist HybridPose sowohl in Bezug auf Laufzeit als auch Genauigkeit vergleichbar. Beispielsweise erreicht unsere Methode auf dem Occlusion Linemod-Datensatz eine Vorhersagegeschwindigkeit von 30 fps bei einer mittleren ADD(-S)-Genauigkeit von 47,5 %, was eine state-of-the-art-Leistung darstellt. Die Implementierung von HybridPose ist unter https://github.com/chensong1995/HybridPose verfügbar.