HyperAIHyperAI

Command Palette

Search for a command to run...

Less is More: Reduzierung von Aufgaben- und Modellkomplexität für die semantische Segmentierung von 3D-Punktwolken

Li Li Hubert P. H. Shum Toby P. Breckon

Zusammenfassung

Während die Verfügbarkeit von 3D-LiDAR-Punktwolken-Daten in den letzten Jahren erheblich gestiegen ist, bleibt die Annotation weiterhin kostspielig und zeitaufwändig, was die Nachfrage nach semi-supervised Methoden für die semantische Segmentierung in Anwendungsbereichen wie autonome Fahrzeuge erhöht. Bisherige Ansätze verwenden häufig relativ große Segmentierungs-Backbone-Netzwerke, um die Segmentierungsgenauigkeit zu verbessern, wodurch jedoch hohe Rechenkosten entstehen. Zudem wird oft eine gleichmäßige Stichprobenziehung eingesetzt, um die Anforderungen an die Ground-Truth-Daten zu reduzieren, was häufig zu suboptimalen Leistungen führt. Um diese Probleme anzugehen, schlagen wir einen neuen Pipeline-Ansatz vor, der eine kompaktere Architektur nutzt und weniger Ground-Truth-Anmerkungen erfordert, um eine überlegene Segmentierungsgenauigkeit im Vergleich zu aktuellen Ansätzen zu erreichen. Dies wird durch ein neuartiges Sparse Depthwise Separable Convolution-Modul ermöglicht, das die Anzahl der Netzwerkparameter erheblich reduziert, ohne die Gesamtleistung der Aufgabe zu beeinträchtigen. Um unsere Trainingsdaten effektiv zu unterstichproben, stellen wir eine neue Methode namens Spatio-Temporal Redundant Frame Downsampling (ST-RFD) vor, die Wissen über die Bewegung der Sensoren in der Umgebung nutzt, um eine diversifiziertere Teilmenge von Trainingsframe-Samples zu extrahieren. Um die Nutzung begrenzter annotierter Daten effizienter zu gestalten, schlagen wir zudem eine Soft-Pseudo-Label-Methode vor, die auf der LiDAR-Reflektivität basiert. Unser Ansatz übertrifft bestehende semi-supervised Methoden hinsichtlich des mIoU-Werts, verwendet dabei weniger gelabelte Daten und erzielt auf den Benchmark-Datensätzen SemanticKITTI (59,5@5%) und ScribbleKITTI (58,1@5%) eine Leistungssteigerung, wobei die Modellparameter um das 2,3-fache reduziert und die Anzahl der Multiply-Add-Operationen um das 641-fache verringert werden. Zudem zeigt unser Verfahren eine signifikante Verbesserung bei begrenzten Trainingsdaten – was die These „Less is More“ untermauert.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp