M$^2$-3DLaneNet : Exploration de la détection multi-modale des lignes de conduite en 3D

L'estimation précise des lignes de voie dans l'espace 3D reste un défi en raison de leur nature éparses et fines. Les travaux précédents se sont principalement concentrés sur l'utilisation d'images pour la détection 3D des lignes de voie, ce qui a conduit à une erreur de projection inhérente et à une perte d'informations géométriques. Pour remédier à ces problèmes, nous explorons le potentiel d'utiliser le LiDAR pour la détection 3D des lignes de voie, que ce soit comme méthode autonome ou en combinaison avec les approches monoculaires existantes. Dans cet article, nous proposons M$^2$-3DLaneNet pour intégrer les informations complémentaires provenant de plusieurs capteurs. Plus précisément, M$^2$-3DLaneNet élève les caractéristiques 2D dans l'espace 3D en incorporant les informations géométriques issues des données LiDAR grâce à l'achèvement de profondeur. Ensuite, les caractéristiques 2D élevées sont encore améliorées par les caractéristiques LiDAR via une fusion BEV (Bird's Eye View) intermodale. De nombreuses expériences menées sur le grand ensemble de données OpenLane montrent l'efficacité de M$^2$-3DLaneNet, indépendamment de la portée (75 m ou 100 m).