RandLA-Net: Effiziente semantische Segmentierung von großflächigen Punktwolken

Wir untersuchen das Problem der effizienten semantischen Segmentierung großer 3D-Punktwolken. Die meisten bestehenden Ansätze sind aufgrund teurer Abtasttechniken oder rechenintensiver Vor- bzw. Nachverarbeitungsschritte lediglich für kleine Punktwolken trainierbar und nutzbar. In diesem Paper stellen wir RandLA-Net vor, eine effiziente und leichtgewichtige neuronale Architektur, die direkt pro-Punkt-Semantik für große 3D-Punktwolken erfasst. Der Schlüssel unserer Methode liegt in der Verwendung von zufälliger Punktabtastung anstelle komplexerer Punktauswahlverfahren. Obwohl diese Herangehensweise bemerkenswert rechen- und speichereffizient ist, kann zufällige Abtastung aus Versehen wichtige Merkmale verlieren. Um dies zu überwinden, führen wir ein neuartiges Modul zur lokalen Merkmalsaggregation ein, das den Empfindungsbereich jedes 3D-Punkts schrittweise vergrößert und somit geometrische Details effektiv bewahrt. Ausführliche Experimente zeigen, dass unser RandLA-Net eine Million Punkte in einem einzigen Durchlauf verarbeiten kann und bis zu 200-mal schneller als bestehende Ansätze arbeitet. Zudem übertrifft unser RandLA-Net klar die derzeitigen State-of-the-Art-Methoden für die semantische Segmentierung auf zwei großen Benchmark-Datensätzen, Semantic3D und SemanticKITTI.