Segmentation en ligne de séquences LiDAR : Jeu de données et algorithme

Les capteurs LiDAR rotatifs montés sur le toit sont largement utilisés par les véhicules autonomes. Cependant, la plupart des ensembles de données sémantiques et des algorithmes utilisés pour le segmentage de séquences LiDAR opèrent sur des trames de $360^\circ$, ce qui entraîne un retard d'acquisition incompatible avec les applications en temps réel. Pour résoudre ce problème, nous introduisons d'abord HelixNet, un ensemble de données de $10$ milliards de points doté d'étiquettes détaillées, de timestamps et d'informations sur la rotation du capteur, nécessaires pour évaluer précisément la capacité des algorithmes de segmentage à fonctionner en temps réel. Ensuite, nous proposons Helix4D, une architecture compacte et efficace de transformateur spatio-temporel spécifiquement conçue pour les séquences LiDAR rotatives. Helix4D opère sur des tranches d'acquisition correspondant à une fraction d'une rotation complète du capteur, réduisant considérablement le retard total. Helix4D atteint une précision comparable à celle des meilleurs algorithmes de segmentage sur HelixNet et SemanticKITTI, tout en réduisant le retard de plus de $5$ fois et la taille du modèle de plus de $50$ fois. Le code et les données sont disponibles à l'adresse suivante : https://romainloiseau.fr/helixnet