HyperAIHyperAI
vor 2 Monaten

Segmentierungsbasierte 6D-Objekt-Pose-Schätzung

Yinlin Hu; Joachim Hugonot; Pascal Fua; Mathieu Salzmann
Segmentierungsbasierte 6D-Objekt-Pose-Schätzung
Abstract

Die neueste Entwicklung bei der Schätzung der 6D-Pose von starreren Objekten besteht darin, tiefe Netzwerke zu trainieren, um entweder die Pose direkt aus dem Bild zu regredieren oder die 2D-Positionen von 3D-Schlüsselpunkten vorherzusagen, aus denen die Pose dann mit einem PnP-Algorithmus berechnet werden kann. In beiden Fällen wird das Objekt als globale Einheit betrachtet und eine einzelne Pose-Schätzung durchgeführt. Als Folge können diese Techniken anfällig für große Verdeckungen sein.In dieser Arbeit stellen wir einen segmentierungsbasierten Rahmen zur Schätzung der 6D-Pose vor, bei dem jeder sichtbare Teil des Objekts eine lokale Pose-Vorhersage in Form von 2D-Schlüsselpunkt-Positionen beiträgt. Wir verwenden dann ein vorhergesagtes Konfidenzmaß, um diese Pose-Kandidaten zu einer robusten Menge von 3D-zu-2D-Korrespondenzen zusammenzuführen, aus denen eine verlässliche Pose-Schätzung abgeleitet werden kann. Auf den anspruchsvollen Occluded-LINEMOD- und YCB-Video-Datensätzen übertreffen wir den aktuellen Stand der Technik, was belegt, dass unser Ansatz gut mit mehreren schlecht texturierten Objekten umgehen kann, die sich gegenseitig verdecken. Darüber hinaus basiert er auf einer einfach genug gestalteten Architektur, um Echtzeit-Leistung zu erreichen.