HyperAIHyperAI
vor 16 Tagen

CDPN: Koordinatenbasiertes entkoppeltes Pose-Netzwerk für die Echtzeit-6-DoF-Objektpose-Schätzung auf Basis von RGB-Daten

{ Xiangyang Ji, Gu Wang, Zhigang Li}
CDPN: Koordinatenbasiertes entkoppeltes Pose-Netzwerk für die Echtzeit-6-DoF-Objektpose-Schätzung auf Basis von RGB-Daten
Abstract

Die Schätzung der 6-DoF-Objektpose aus einem einzigen RGB-Bild ist ein grundlegendes und lang bestehendes Problem in der Computer Vision. Aktuelle führende Ansätze lösen dieses Problem, indem sie tiefe Netzwerke trainieren, um entweder direkt Rotation und Translation aus dem Bild zu regressieren oder 2D-3D-Zuordnungen zu konstruieren und diese anschließend über PnP (Perspective-n-Point) indirekt zu lösen. Wir argumentieren, dass Rotation und Translation aufgrund ihrer erheblichen Unterschiede unterschiedlich behandelt werden sollten. In dieser Arbeit präsentieren wir einen neuartigen Ansatz zur 6-DoF-Pose-Schätzung: das Coordinate-basierte entkoppelte Pose-Netzwerk (CDPN), das die Pose entkoppelt, um Rotation und Translation getrennt vorherzusagen, um eine hochgenaue und robuste Pose-Schätzung zu erreichen. Unser Verfahren ist flexibel, effizient, äußerst genau und verarbeitet auch objektlose und teilweise verdeckte Objekte. Umfassende Experimente auf den Datensätzen LINEMOD und Occlusion zeigen die Überlegenheit unseres Ansatzes. Konkret übertrifft unsere Methode die State-of-the-Art-Methoden auf Basis von RGB-Bildern signifikant hinsichtlich gängiger Bewertungsmaße.

CDPN: Koordinatenbasiertes entkoppeltes Pose-Netzwerk für die Echtzeit-6-DoF-Objektpose-Schätzung auf Basis von RGB-Daten | Neueste Forschungsarbeiten | HyperAI