LaserMix für semi-supervised LiDAR-Semantische Segmentierung

Die dichte Annotation von LiDAR-Punktwolken ist kostenaufwendig und hemmt die Skalierbarkeit vollständig überwachter Lernmethoden. In dieser Arbeit untersuchen wir das untererforschte semi-supervised Learning (SSL) im Bereich der LiDAR-Segmentation. Unser zentrales Konzept besteht darin, die starken räumlichen Hinweise in LiDAR-Punktwolken zu nutzen, um unlabeled Daten effektiver auszunutzen. Wir stellen LaserMix vor, eine Methode, die Laserstrahlen aus verschiedenen LiDAR-Aufnahmen mischt, und die das Modell dazu anregt, vor und nach der Mischung konsistente und zuverlässige Vorhersagen zu treffen. Unser Framework weist drei ansprechende Eigenschaften auf: 1) Allgemeinheit: LaserMix ist unabhängig von der Darstellung der LiDAR-Daten (z. B. Range-View oder Voxel), wodurch unser SSL-Framework universell einsetzbar ist. 2) Statistisch fundiert: Wir führen eine detaillierte Analyse durch und erklären theorethisch die Anwendbarkeit des vorgeschlagenen Ansatzes. 3) Wirksamkeit: Umfassende experimentelle Analysen auf etablierten LiDAR-Segmentation-Datensätzen (nuScenes, SemanticKITTI und ScribbleKITTI) belegen die Effektivität und Überlegenheit unseres Verfahrens. Insbesondere erreichen wir mit 2- bis 5-fach weniger Labels wettbewerbsfähige Ergebnisse gegenüber vollständig überwachten Ansätzen und verbessern die reine überwachte Baseline im Durchschnitt um 10,8 %. Wir hoffen, dass dieses kompakte und leistungsfähige Framework zukünftige Forschung im Bereich des semi-supervised LiDAR-Segmentation fördern wird. Der Quellcode ist öffentlich verfügbar.