PolarNet: Eine verbesserte Gitterdarstellung für die semantische Segmentierung von Online-LiDAR-Punktwolken

Die Notwendigkeit feingranularen Wahrnehmens in autonomen Fahrzeugsystemen hat zu einer steigenden Forschung über die Online-Semantische Segmentierung von einzelnen LiDAR-Scans geführt. Trotz der aufkommenden Datensätze und technologischen Fortschritte bleibt dies aufgrund dreier Gründe herausfordernd: (1) die Notwendigkeit von nahezu Echtzeit-Latenz mit begrenzter Hardware; (2) ungleichmäßige oder sogar langschwänzige Verteilung von LiDAR-Punkten im Raum; und (3) eine zunehmende Anzahl extrem feingranularer semantischer Klassen. In einem Versuch, alle genannten Herausforderungen gemeinsam anzugehen, schlagen wir einen neuen, speziell für LiDAR entwickelten Segmentationalgorithmus vor – PolarNet. Anstelle der üblichen sphärischen oder Vogelperspektiv-Projektion verwendet unsere polare Vogelperspektiv-Darstellung eine ausgewogene Verteilung der Punkte in Gitterzellen in einem Polarkoordinatensystem, was indirekt die Aufmerksamkeit des Segmentierungsnetzes mit der langschwänzigen Verteilung der Punkte entlang der radialen Achse ausrichtet. Wir stellen fest, dass unser Kodierungsschema das mIoU in drei stark unterschiedlichen Segmentationdatensätzen von realen städtischen LiDAR-Einzelscans erheblich verbessert, während es gleichzeitig nahezu Echtzeit-Durchsatz beibehält.