HyperAIHyperAI
vor 13 Tagen

EfficientPose: Ein effizienter, genauer und skalierbarer end-to-end Ansatz zur 6D-Mehrobject-Pose-Schätzung

Yannick Bukschat, Marcus Vetter
EfficientPose: Ein effizienter, genauer und skalierbarer end-to-end Ansatz zur 6D-Mehrobject-Pose-Schätzung
Abstract

In diesem Paper stellen wir EfficientPose vor, einen neuen Ansatz zur Schätzung der 6D-Objektpose. Unser Verfahren ist hochpräzise, effizient und skaliert über einen weiten Bereich an Rechenressourcen. Zudem kann es die 2D-Bounding-Boxes mehrerer Objekte und Instanzen sowie deren vollständige 6D-Pose in einem einzigen Schritt detektieren und schätzen. Dadurch wird der signifikante Anstieg der Laufzeit vermieden, den andere Ansätze bei der Behandlung mehrerer Objekte aufweisen. Diese herkömmlichen Methoden zielen zunächst darauf ab, 2D-Ziele wie z. B. Schlüsselpunkte zu detektieren, und lösen anschließend für jedes Objekt ein Perspective-n-Point-Problem, um die 6D-Pose zu schätzen. Wir schlagen zudem eine neue Augmentierungsmethode für direkte 6D-Pose-Schätzungsmethoden vor, die Leistung und Generalisierung verbessert und als 6D-Augmentierung bezeichnet wird. Unser Ansatz erreicht eine neue State-of-the-Art-Genauigkeit von 97,35 % bezüglich des ADD(-S)-Metriken auf dem weit verbreiteten 6D-Pose-Schätzungsbenchmark-Datensatz Linemod unter Verwendung von RGB-Eingaben und läuft dennoch end-to-end mit über 27 FPS. Durch die inhärente Behandlung mehrerer Objekte und Instanzen sowie die integrierte Einzelschritt-2D-Objektdetektion und 6D-Pose-Schätzung erreicht unser Ansatz auch bei mehreren Objekten (bis zu acht) eine end-to-end-Geschwindigkeit von über 26 FPS, was ihn für zahlreiche Anwendungen in der realen Welt äußerst attraktiv macht. Der Quellcode wird öffentlich unter https://github.com/ybkscht/EfficientPose zur Verfügung gestellt.