HyperAIHyperAI
vor 11 Tagen

TFNet: Ausnutzung zeitlicher Hinweise für eine schnelle und genaue semantische Segmentierung von LiDAR-Daten

Rong Li, ShiJie Li, Xieyuanli Chen, Teli Ma, Juergen Gall, Junwei Liang
TFNet: Ausnutzung zeitlicher Hinweise für eine schnelle und genaue semantische Segmentierung von LiDAR-Daten
Abstract

Die semantische Segmentierung mittels LiDAR spielt eine entscheidende Rolle dabei, autonome Fahrzeuge und Roboter in der Lage zu versetzen, ihre Umgebung präzise und robust zu verstehen. Innerhalb dieses Bereichs existieren zahlreiche Ansätze, darunter punktbasierte, auf Bereichsbildern basierende, auf Polarkoordinaten basierende sowie hybride Strategien. Unter diesen haben die auf Bereichsbildern basierenden Techniken aufgrund ihrer Effizienz eine breite Anwendung in der Praxis gefunden. Sie stoßen jedoch auf eine erhebliche Herausforderung, die sogenannte „Many-to-One“-Problematik, verursacht durch die begrenzte horizontale und vertikale Winkelauflösung des Bereichsbildes. Dadurch können etwa 20 % der 3D-Punkte verdeckt sein. In diesem Artikel präsentieren wir TFNet, eine auf Bereichsbildern basierende Methode zur semantischen Segmentierung von LiDAR-Daten, die zeitliche Informationen nutzt, um dieses Problem zu bewältigen. Konkret integrieren wir eine zeitliche Fusions-Schicht, um nützliche Informationen aus vorherigen Scans zu extrahieren und diese mit dem aktuellen Scan zu kombinieren. Anschließend entwickeln wir eine auf Maximalabstimmung (max-voting) basierende Nachbearbeitungstechnik, um falsche Vorhersagen – insbesondere solche, die durch die „Many-to-One“-Problematik verursacht werden – zu korrigieren. Wir haben unseren Ansatz an zwei Benchmark-Datenbanken evaluiert und gezeigt, dass die plug-in-fähige Nachbearbeitungstechnik generisch ist und auf verschiedene Netzwerke angewendet werden kann.