K-Lane : Jeu de données Lidar et benchmark pour les routes urbaines et autoroutes

La détection des lignes de chaussée constitue une fonction essentielle pour les véhicules autonomes. Grâce au développement récent des réseaux de neurones profonds ainsi qu’à la publication de jeux de données et de benchmarks dédiés aux caméras, les réseaux de détection des lignes de chaussée basés sur les caméras (CLDNs) ont connu une avancée notable. Toutefois, les CLDNs dépendent des images capturées par des caméras, qui sont fréquemment déformées près de la ligne de fuite et sujettes à des conditions d’éclairage défavorables. Cela contraste avec les réseaux de détection des lignes de chaussée basés sur le Lidar (LLDNs), capables d’extraire directement les lignes de chaussée dans une vue de dessus (BEV – Bird’s Eye View), ce qui est particulièrement utile pour la planification du mouvement, et qui fonctionnent de manière robuste sous diverses conditions d’éclairage. Malgré ces avantages, les LLDNs n’ont pas été largement étudiés, principalement en raison du manque de grands jeux de données publics Lidar dédiés à la détection des lignes de chaussée. Dans cet article, nous introduisons KAIST-Lane (K-Lane), le premier et le plus vaste jeu de données public dédié aux lignes de chaussée sur routes urbaines et autoroutes, basé sur le Lidar. K-Lane comprend plus de 15 000 images (frames) et contient des annotations de jusqu’à six voies, couvrant une grande variété de conditions routières et de trafic, telles que des routes partiellement masquées à différents niveaux d’occlusion, des routes observées de jour comme de nuit, ainsi que des voies en raccordement (convergentes ou divergentes) ou courbées. Nous proposons également des réseaux de base que nous appelons LLDN-GFC (Lidar Lane Detection Networks using Global Feature Correlator). LLDN-GFC exploite les caractéristiques spatiales des lignes de chaussée dans les nuages de points, qui sont caractérisés par une faible densité, une finesse extrême et une extension continue le long du plan de sol du nuage de points. Les résultats expérimentaux montrent que LLDN-GFC atteint une performance de pointe, avec un score F1 de 82,1 % sur K-Lane. En outre, LLDN-GFC présente une robustesse remarquable sous diverses conditions d’éclairage, contrairement aux CLDNs, et demeure efficace même en cas d’occlusions sévères, contrairement aux LLDNs classiques basés sur les CNN. Le jeu de données K-Lane, le code d’entraînement de LLDN-GFC, les modèles pré-entraînés ainsi que l’ensemble complet d’outils de développement incluant des outils d’évaluation, de visualisation et d’annotation sont disponibles à l’adresse suivante : https://github.com/kaist-avelab/k-lane.