HyperAIHyperAI
vor 2 Monaten

DenseFusion: 6D-Objekt-Pose-Schätzung durch iterative dichte Fusion

Wang, Chen ; Xu, Danfei ; Zhu, Yuke ; Martín-Martín, Roberto ; Lu, Cewu ; Fei-Fei, Li ; Savarese, Silvio
DenseFusion: 6D-Objekt-Pose-Schätzung durch iterative dichte Fusion
Abstract

Eine wesentliche technische Herausforderung bei der Durchführung der 6D-Objekt-Pose-Schätzung aus RGB-D-Bildern besteht darin, die beiden ergänzenden Datenquellen vollständig zu nutzen. Frühere Arbeiten extrahierten entweder Informationen aus dem RGB-Bild und der Tiefeninformation getrennt voneinander oder verwendeten aufwendige Nachbearbeitungsschritte, was ihre Leistungsfähigkeit in stark verunreinigten Szenen und Echtzeit-Anwendungen einschränkte. In dieser Arbeit stellen wir DenseFusion vor, ein generisches Framework zur Schätzung der 6D-Pose einer Reihe bekannter Objekte aus RGB-D-Bildern. DenseFusion ist eine heterogene Architektur, die die beiden Datenquellen einzeln verarbeitet und ein neuartiges dichtes Fusionsnetzwerk verwendet, um pixelweise dichte Merkmalsrepräsentationen zu extrahieren, aus denen die Pose geschätzt wird. Darüber hinaus integrieren wir einen end-to-end iterativen Pose-Verfeinerungsprozess, der die Pose-Schätzung weiter verbessert und gleichzeitig nahezu Echtzeitschätzungen ermöglicht. Unsere Experimente zeigen, dass unsere Methode in zwei Datensätzen, YCB-Video und LineMOD, den aktuellen Stand der Technik übertrifft. Wir haben auch unsere vorgeschlagene Methode in einem echten Roboter implementiert, um Objekte basierend auf der geschätzten Pose zu greifen und zu manipulieren.

DenseFusion: 6D-Objekt-Pose-Schätzung durch iterative dichte Fusion | Neueste Forschungsarbeiten | HyperAI