Verwendung eines Waffeleisens für die semantische Segmentierung von automobilen Punktwolken

Die semantische Segmentierung von Punktwolken in Datensätzen für autonome Fahrzeuge erfordert Techniken, die große Anzahlen von Punkten effizient verarbeiten können. Dünne 3D-Faltungen (sparse 3D convolutions) sind zu Standardwerkzeugen geworden, um tiefere neuronale Netze für diese Aufgabe zu konstruieren: Sie nutzen die Sparsität der Punktwolken, um den Speicher- und Rechenaufwand zu reduzieren und bilden den Kern der besten heutigen Methoden. In dieser Arbeit schlagen wir eine alternative Methode vor, die das Niveau der Standesder-methoden erreicht, ohne dünne Faltungen zu benötigen. Wir zeigen tatsächlich, dass ein solches Leistungslevel durch das Verwenden von Werkzeugen erreichbar ist, die a priori nicht für groß angelegte und hochleistungsfähige 3D-Wahrnehmung geeignet erscheinen. Insbesondere stellen wir einen neuen 3D-Rumpf (backbone), WaffleIron, vor, der fast ausschließlich aus MLPs (Multi-Layer Perceptrons) und dichten 2D-Faltungen besteht, und präsentieren, wie man ihn trainiert, um hohe Leistungen auf SemanticKITTI und nuScenes zu erzielen. Wir glauben, dass WaffleIron eine überzeugende Alternative zu Rümpfen darstellt, die dünne 3D-Faltungen verwenden, insbesondere in Frameworks und auf Hardware, wo diese Faltungen nicht leicht verfügbar sind.