HyperAIHyperAI
vor 2 Monaten

Monokulare 3D-Objekterkennung mit genauen Vorschlägen und Formrekonstruktion

Jason Ku; Alex D. Pon; Steven L. Waslander
Monokulare 3D-Objekterkennung mit genauen Vorschlägen und Formrekonstruktion
Abstract

Wir präsentieren MonoPSR, eine Methode zur monokularen 3D-Objekterkennung, die Vorschläge und Formrekonstruktion nutzt. Zunächst werden durch den Einsatz eines reifen 2D-Objektdetektors und unter Verwendung der grundlegenden Beziehungen des Pinhole-Kameramodells für jedes Objekt in einer Szene 3D-Vorschläge generiert. Die 3D-Lage dieser Vorschläge erweist sich als sehr genau, was die Schwierigkeit der Regression des endgültigen 3D-Bounding-Box-Detektions erheblich verringert. Gleichzeitig wird ein Punktwolkenmodell in einem objektorientierten Koordinatensystem vorhergesagt, um lokale Skalen- und Forminformationen zu lernen. Dennoch stellt sich die Haupt Herausforderung dar, wie Forminformationen zur Steuerung der 3D-Lokalisierung genutzt werden können. Daher entwickeln wir aggregierte Verlustfunktionen, darunter einen neuartigen Projektionsausrichtungsverlust (projection alignment loss), um diese Aufgaben im neuronalen Netzwerk gemeinsam zu optimieren und so die Genauigkeit der 3D-Lokalisierung zu verbessern. Unsere Methode wird am KITTI-Benchmark validiert, wo sie unter den veröffentlichten monokularen Methoden neue Standarteinstellungen erreicht, insbesondere in den schwierigeren Klassen von Fußgängern und Radfahrern, während gleichzeitig eine effiziente Laufzeit gewährleistet wird.

Monokulare 3D-Objekterkennung mit genauen Vorschlägen und Formrekonstruktion | Neueste Forschungsarbeiten | HyperAI