Neuüberprüfung der Formklassifizierung von Punktwolken mit einer einfachen und effektiven Baseline

Die Verarbeitung von Punktwolken-Daten ist eine zentrale Komponente vieler realweltlicher Systeme. Daher wurden zahlreiche punktbasierte Ansätze vorgeschlagen, die im Laufe der Zeit kontinuierliche Verbesserungen in den Benchmark-Ergebnissen verzeichnen. Wir untersuchen die entscheidenden Faktoren dieses Fortschritts und identifizieren zwei zentrale Erkenntnisse. Erstens stellen wir fest, dass Hilfsfaktoren wie unterschiedliche Evaluierungsschemata, Strategien zur Datenaugmentation und Verlustfunktionen – unabhängig von der Modellarchitektur – erhebliche Auswirkungen auf die Leistung haben. Diese Unterschiede sind so groß, dass sie die Auswirkungen der Architektur verdecken. Sobald diese Faktoren kontrolliert werden, erzielt PointNet++, ein vergleichsweise älteres Netzwerk, eine konkurrenzfähige Leistung gegenüber neueren Methoden. Zweitens zeigt sich, dass ein sehr einfacher, auf Projektion basierender Ansatz – den wir SimpleView nennen – überraschend gut abschneidet. Er erreicht Ergebnisse, die mit oder sogar besser sind als die komplexer, state-of-the-art-Methoden auf dem ModelNet40-Datensatz, während er nur halb so groß wie PointNet++ ist. Zudem übertrifft SimpleView state-of-the-art-Methoden auf ScanObjectNN, einem realen Welt-Punktwolken-Benchmark, und demonstriert eine bessere Generalisierung über Datensätze hinweg. Der Quellcode ist unter https://github.com/princeton-vl/SimpleView verfügbar.