HyperAIHyperAI
vor 2 Monaten

Orientierungsverstärkte Voxel-Netze für die 3D-Objekterkennung

Nima Sedaghat; Mohammadreza Zolfaghari; Ehsan Amiri; Thomas Brox
Orientierungsverstärkte Voxel-Netze für die 3D-Objekterkennung
Abstract

Neuere Arbeiten haben gute Erkennungsergebnisse bei der 3D-Objekterkennung unter Verwendung von 3D-Faltungssnetzen gezeigt. In dieser Arbeit demonstrieren wir, dass die Objektorientierung eine wichtige Rolle bei der 3D-Erkennung spielt. Genauer gesagt argumentieren wir, dass Objekte beim Drehen unterschiedliche Merkmale im Netzwerk induzieren. Daher behandeln wir die kategorienübergreifende Klassifikationsaufgabe als ein Multi-Task-Problem, bei dem das Netzwerk parallel zur Klassenbezeichnung auch die Pose des Objekts vorhersagen soll. Wir zeigen, dass dies zu erheblichen Verbesserungen der Klassifikationsergebnisse führt. Unsere vorgeschlagene Architektur testen wir auf mehreren Datensätzen, die verschiedene Quellen von 3D-Daten repräsentieren: LiDAR-Daten, CAD-Modelle und RGB-D-Bilder. Wir berichten über Stand-des-Wissens-Ergebnisse in der Klassifikation sowie erhebliche Verbesserungen in Präzision und Geschwindigkeit im Vergleich zum Baseline-Modell bei der 3D-Erkennung.

Orientierungsverstärkte Voxel-Netze für die 3D-Objekterkennung | Neueste Forschungsarbeiten | HyperAI