HyperAIHyperAI
vor 2 Monaten

Volumetrische und mehransichtsbasierte CNNs für die Objektklassifizierung auf 3D-Daten

Charles R. Qi; Hao Su; Matthias Niessner; Angela Dai; Mengyuan Yan; Leonidas J. Guibas
Volumetrische und mehransichtsbasierte CNNs für die Objektklassifizierung auf 3D-Daten
Abstract

3D-Formmodelle werden zunehmend verfügbar und einfacher zu erfassen, wodurch die Verwendung von 3D-Informationen für Fortschritte in der Objektklassifikation entscheidend wird. Aktuelle Methoden auf dem Stand der Technik basieren auf CNNs (Convolutional Neural Networks), um dieses Problem anzugehen. Kürzlich beobachten wir die Entwicklung zweier Arten von CNNs: CNNs, die auf volumetrischen Darstellungen basieren, im Gegensatz zu CNNs, die auf multiview-Darstellungen basieren. Empirische Ergebnisse dieser beiden Arten von CNNs zeigen einen großen Unterschied, was darauf hindeutet, dass bestehende architektonische Ansätze und Methoden für volumetrische CNNs das volle Potenzial der 3D-Darstellungen nicht vollständig nutzen können. In diesem Artikel streben wir an, sowohl volumetrische als auch multiview-CNNs durch eine umfassende Analyse bestehender Ansätze zu verbessern. Dazu führen wir zwei unterschiedliche Netzwerkarchitekturen für volumetrische CNNs ein. Zudem untersuchen wir multiview-CNNs, wo wir Filterung in 3D mit mehreren Auflösungen (multi-resolution filtering) einführen. Insgesamt sind wir in der Lage, den aktuellen Stand der Technik sowohl bei volumetrischen als auch bei multiview-CNNs zu übertreffen. Wir präsentieren umfangreiche Experimente, die darauf abzielen, grundlegende Designentscheidungen zu evaluieren und so ein tieferes Verständnis des Spektrums der zur Verfügung stehenden Methoden für die Objektklassifikation mit 3D-Daten zu fördern.

Volumetrische und mehransichtsbasierte CNNs für die Objektklassifizierung auf 3D-Daten | Neueste Forschungsarbeiten | HyperAI