HyperAIHyperAI

Command Palette

Search for a command to run...

DenseFusion: 6D-Objekt-Pose-Schätzung durch iterative dichte Fusion

Chen Wang Danfei Xu Yuke Zhu Roberto Martín-Martín Cewu Lu Li Fei-Fei Silvio Savarese

Zusammenfassung

Eine wesentliche technische Herausforderung bei der Durchführung der 6D-Objekt-Pose-Schätzung aus RGB-D-Bildern besteht darin, die beiden ergänzenden Datenquellen vollständig zu nutzen. Frühere Arbeiten extrahierten entweder Informationen aus dem RGB-Bild und der Tiefeninformation getrennt voneinander oder verwendeten aufwendige Nachbearbeitungsschritte, was ihre Leistungsfähigkeit in stark verunreinigten Szenen und Echtzeit-Anwendungen einschränkte. In dieser Arbeit stellen wir DenseFusion vor, ein generisches Framework zur Schätzung der 6D-Pose einer Reihe bekannter Objekte aus RGB-D-Bildern. DenseFusion ist eine heterogene Architektur, die die beiden Datenquellen einzeln verarbeitet und ein neuartiges dichtes Fusionsnetzwerk verwendet, um pixelweise dichte Merkmalsrepräsentationen zu extrahieren, aus denen die Pose geschätzt wird. Darüber hinaus integrieren wir einen end-to-end iterativen Pose-Verfeinerungsprozess, der die Pose-Schätzung weiter verbessert und gleichzeitig nahezu Echtzeitschätzungen ermöglicht. Unsere Experimente zeigen, dass unsere Methode in zwei Datensätzen, YCB-Video und LineMOD, den aktuellen Stand der Technik übertrifft. Wir haben auch unsere vorgeschlagene Methode in einem echten Roboter implementiert, um Objekte basierend auf der geschätzten Pose zu greifen und zu manipulieren.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp