HyperAIHyperAI

Command Palette

Search for a command to run...

CDPN: Koordinatenbasiertes entkoppeltes Pose-Netzwerk für die Echtzeit-6-DoF-Objektpose-Schätzung auf Basis von RGB-Daten

Xiangyang Ji Gu Wang Zhigang Li

Zusammenfassung

Die Schätzung der 6-DoF-Objektpose aus einem einzigen RGB-Bild ist ein grundlegendes und lang bestehendes Problem in der Computer Vision. Aktuelle führende Ansätze lösen dieses Problem, indem sie tiefe Netzwerke trainieren, um entweder direkt Rotation und Translation aus dem Bild zu regressieren oder 2D-3D-Zuordnungen zu konstruieren und diese anschließend über PnP (Perspective-n-Point) indirekt zu lösen. Wir argumentieren, dass Rotation und Translation aufgrund ihrer erheblichen Unterschiede unterschiedlich behandelt werden sollten. In dieser Arbeit präsentieren wir einen neuartigen Ansatz zur 6-DoF-Pose-Schätzung: das Coordinate-basierte entkoppelte Pose-Netzwerk (CDPN), das die Pose entkoppelt, um Rotation und Translation getrennt vorherzusagen, um eine hochgenaue und robuste Pose-Schätzung zu erreichen. Unser Verfahren ist flexibel, effizient, äußerst genau und verarbeitet auch objektlose und teilweise verdeckte Objekte. Umfassende Experimente auf den Datensätzen LINEMOD und Occlusion zeigen die Überlegenheit unseres Ansatzes. Konkret übertrifft unsere Methode die State-of-the-Art-Methoden auf Basis von RGB-Bildern signifikant hinsichtlich gängiger Bewertungsmaße.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
CDPN: Koordinatenbasiertes entkoppeltes Pose-Netzwerk für die Echtzeit-6-DoF-Objektpose-Schätzung auf Basis von RGB-Daten | Paper | HyperAI