Online-Segmentierung von LiDAR-Sequenzen: Datensatz und Algorithmus

Dachmontierte rotierende LiDAR-Sensoren werden von autonomen Fahrzeugen weitgehend eingesetzt. Die meisten semantischen Datensätze und Algorithmen, die für die Segmentierung von LiDAR-Sequenzen verwendet werden, arbeiten jedoch mit $360^\circ$-Bildern, was zu einer Erfassungsverzögerung führt, die mit Echtzeitanwendungen unvereinbar ist. Um dieses Problem zu lösen, stellen wir zunächst HelixNet vor, einen Datensatz mit 10 Milliarden Punkten, der feingranulare Labels, Zeitstempel und Sensordrehinformationen enthält, die notwendig sind, um die Echtzeitfähigkeit von Segmentierungsalgorithmen präzise zu bewerten. Zweitens schlagen wir Helix4D vor, eine kompakte und effiziente räumlich-zeitliche Transformer-Architektur, die speziell für rotierende LiDAR-Sequenzen entwickelt wurde. Helix4D verarbeitet Erfassungsschnitte, die einem Bruchteil einer vollständigen Sensordrehung entsprechen, was die gesamte Verzögerung erheblich reduziert. Helix4D erreicht eine Genauigkeit, die mit den besten Segmentierungsalgorithmen auf HelixNet und SemanticKITTI vergleichbar ist, wobei es gleichzeitig eine Verzögerungsreduzierung von über 5-fach und eine Modellgröße von 50-fach kleiner bietet. Der Code und die Daten sind unter folgender URL verfügbar: https://romainloiseau.fr/helixnet