HyperAIHyperAI
vor 11 Tagen

Less is More: Reduzierung von Aufgaben- und Modellkomplexität für die semantische Segmentierung von 3D-Punktwolken

Li Li, Hubert P. H. Shum, Toby P. Breckon
Less is More: Reduzierung von Aufgaben- und Modellkomplexität für die semantische Segmentierung von 3D-Punktwolken
Abstract

Während die Verfügbarkeit von 3D-LiDAR-Punktwolken-Daten in den letzten Jahren erheblich gestiegen ist, bleibt die Annotation weiterhin kostspielig und zeitaufwändig, was die Nachfrage nach semi-supervised Methoden für die semantische Segmentierung in Anwendungsbereichen wie autonome Fahrzeuge erhöht. Bisherige Ansätze verwenden häufig relativ große Segmentierungs-Backbone-Netzwerke, um die Segmentierungsgenauigkeit zu verbessern, wodurch jedoch hohe Rechenkosten entstehen. Zudem wird oft eine gleichmäßige Stichprobenziehung eingesetzt, um die Anforderungen an die Ground-Truth-Daten zu reduzieren, was häufig zu suboptimalen Leistungen führt. Um diese Probleme anzugehen, schlagen wir einen neuen Pipeline-Ansatz vor, der eine kompaktere Architektur nutzt und weniger Ground-Truth-Anmerkungen erfordert, um eine überlegene Segmentierungsgenauigkeit im Vergleich zu aktuellen Ansätzen zu erreichen. Dies wird durch ein neuartiges Sparse Depthwise Separable Convolution-Modul ermöglicht, das die Anzahl der Netzwerkparameter erheblich reduziert, ohne die Gesamtleistung der Aufgabe zu beeinträchtigen. Um unsere Trainingsdaten effektiv zu unterstichproben, stellen wir eine neue Methode namens Spatio-Temporal Redundant Frame Downsampling (ST-RFD) vor, die Wissen über die Bewegung der Sensoren in der Umgebung nutzt, um eine diversifiziertere Teilmenge von Trainingsframe-Samples zu extrahieren. Um die Nutzung begrenzter annotierter Daten effizienter zu gestalten, schlagen wir zudem eine Soft-Pseudo-Label-Methode vor, die auf der LiDAR-Reflektivität basiert. Unser Ansatz übertrifft bestehende semi-supervised Methoden hinsichtlich des mIoU-Werts, verwendet dabei weniger gelabelte Daten und erzielt auf den Benchmark-Datensätzen SemanticKITTI (59,5@5%) und ScribbleKITTI (58,1@5%) eine Leistungssteigerung, wobei die Modellparameter um das 2,3-fache reduziert und die Anzahl der Multiply-Add-Operationen um das 641-fache verringert werden. Zudem zeigt unser Verfahren eine signifikante Verbesserung bei begrenzten Trainingsdaten – was die These „Less is More“ untermauert.

Less is More: Reduzierung von Aufgaben- und Modellkomplexität für die semantische Segmentierung von 3D-Punktwolken | Neueste Forschungsarbeiten | HyperAI