HyperAIHyperAI

Command Palette

Search for a command to run...

6-freiheitsgradige Objekt-Pose aus semantischen Schlüsselpunkten

Georgios Pavlakos Xiaowei Zhou Aaron Chan Konstantinos G. Derpanis Kostas Daniilidis

Zusammenfassung

Dieses Papier präsentiert einen neuen Ansatz zur Schätzung der kontinuierlichen sechs Freiheitsgrade (6-DoF) Pose (3D-Translation und -Rotation) eines Objekts aus einem einzelnen RGB-Bild. Der Ansatz kombiniert semantische Schlüsselpunkte, die von einem Faltungsnetzwerk (ConvNet) vorhergesagt werden, mit einem deformierbaren Formmodell. Im Gegensatz zu früheren Arbeiten sind wir unabhängig davon, ob das Objekt texturiert oder texturelos ist, da das ConvNet die optimale Darstellung aus den verfügbaren Trainingsbildern lernt. Des Weiteren kann der Ansatz sowohl für instanzbasierte als auch für klassenbasierte Pose-Rekonstruktion angewendet werden. Empirisch zeigen wir, dass der vorgeschlagene Ansatz die 6-DoF-Pose des Objekts in beiden Szenarien – instanzbasiert und klassenbasiert – mit einer klutterigen Hintergrundgenauigkeit schätzen kann. Für die klassenbasierte Objektpose-Schätzung wird eine Stand-der-Technik-Genauigkeit auf dem groß angelegten PASCAL3D+-Datensatz demonstriert.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp