HyperAIHyperAI
vor 11 Tagen

Multi-Projection-Fusion für die Echtzeit-Semantische Segmentierung von 3D-LiDAR-Punktwolken

Yara Ali Alnaggar, Mohamed Afifi, Karim Amer, Mohamed Elhelw
Multi-Projection-Fusion für die Echtzeit-Semantische Segmentierung von 3D-LiDAR-Punktwolken
Abstract

Die semantische Segmentierung von 3D-Punktwolken ist entscheidend für eine verbesserte hochstufige Wahrnehmung in autonomen Plattformen. Angesichts der zunehmenden Integration von LiDAR-Sensoren in Fahrzeuge und Drohnen kommt zudem besonderer Wert auf rechenzeitarme Algorithmen zu, die auf mobilen GPUs lauffähig sind. Frühere effiziente State-of-the-Art-Verfahren basierten auf der 2D-sphärischen Projektion von Punktwolken als Eingabe für 2D-voll konvolutionale neuronale Netzwerke, um ein Gleichgewicht zwischen Genauigkeit und Geschwindigkeit zu erreichen. In dieser Arbeit wird ein neuartiger Ansatz für die semantische Segmentierung von 3D-Punktwolken vorgestellt, der mehrere Projektionen der Punktwolke nutzt, um den Informationsverlust zu verringern, der bei Methoden mit einzelner Projektion inhärent ist. Unser Multi-Projection-Fusion-(MPF)-Framework analysiert sphärische und Vogelperspektiv-Projektionen mithilfe zweier getrennter, hoch-effizienter 2D-voll konvolutionaler Modelle und kombiniert anschließend die Segmentierungsergebnisse beider Perspektiven. Das vorgeschlagene Framework wurde auf dem SemanticKITTI-Datensatz validiert und erzielte dabei eine mIoU von 55,5 – dies übertrifft die derzeitigen state-of-the-art-Verfahren auf Basis von Projektionen, RangeNet++ und PolarNet, und zwar bei einer Geschwindigkeit, die 1,6-mal höher ist als bei RangeNet++ und 3,1-mal höher als bei PolarNet.

Multi-Projection-Fusion für die Echtzeit-Semantische Segmentierung von 3D-LiDAR-Punktwolken | Neueste Forschungsarbeiten | HyperAI