Mehrskalige Interaktion für die Echtzeit-Segmentierung von LiDAR-Daten auf einer eingebetteten Plattform

Die Echtzeit-Semantische Segmentierung von LiDAR-Daten ist für autonome Fahrzeuge entscheidend, die in der Regel mit einer eingebetteten Plattform und begrenzten Rechenressourcen ausgestattet sind. Ansätze, die direkt auf dem Punktwolken-Datensatz operieren, verwenden komplexe räumliche Aggregationsoperationen, die sehr aufwendig sind und sich schwer für eingebettete Plattformen optimieren lassen. Sie sind daher nicht für Echtzeitanwendungen mit eingebetteten Systemen geeignet. Als Alternative sind projektionsbasierte Methoden effizienter und können auf eingebetteten Plattformen laufen. Die derzeit besten projektionsbasierten Methoden erreichen jedoch nicht die gleiche Genauigkeit wie punktbasierte Methoden und verwenden Millionen von Parametern. In dieser Arbeit schlagen wir daher eine projektionsbasierte Methode vor, das sogenannte Multi-Skalen-Interaktionsnetzwerk (Multi-scale Interaction Network [MINet]), das sehr effizient und genau ist. Das Netzwerk verwendet mehrere Pfade mit unterschiedlichen Skalen und verteilt die Rechenressourcen zwischen den Skalen ausgewogen. Zusätzliche dichte Interaktionen zwischen den Skalen vermeiden redundante Berechnungen und machen das Netzwerk hochgradig effizient. Das vorgeschlagene Netzwerk übertrifft punktbasierte, bildbasierte und projektionsbasierte Methoden hinsichtlich Genauigkeit, Anzahl der Parameter und Laufzeit. Darüber hinaus verarbeitet das Netzwerk mehr als 24 Scans pro Sekunde auf einer eingebetteten Plattform, was höher ist als die Frameraten von LiDAR-Sensoren. Das Netzwerk ist daher für autonome Fahrzeuge geeignet.