HyperAIHyperAI
il y a 2 mois

Anchor3DLane : Apprentissage de la régression d'ancres 3D pour la détection monulaire de voies 3D

Huang, Shaofei ; Shen, Zhenwei ; Huang, Zehao ; Ding, Zi-han ; Dai, Jiao ; Han, Jizhong ; Wang, Naiyan ; Liu, Si
Anchor3DLane : Apprentissage de la régression d'ancres 3D pour la détection monulaire de voies 3D
Résumé

La détection monulaire de voies 3D est une tâche complexe en raison du manque d'informations sur la profondeur. Une solution courante consiste à transformer les images ou les caractéristiques vues de face (FV) dans l'espace vue d'oiseau (BEV) à l'aide de la transformation inverse de perspective (IPM), puis à détecter les voies à partir des caractéristiques BEV. Cependant, la dépendance de l'IPM à l'hypothèse d'un sol plat et la perte d'informations contextuelles rendent son utilisation peu précise pour restituer les informations 3D à partir des représentations BEV. Une tentative a été faite pour se passer de BEV et prédire directement les voies 3D à partir des représentations FV, mais cette approche sous-performe encore par rapport aux méthodes basées sur BEV en raison du manque de représentation structurée pour les voies 3D. Dans cet article, nous définissons des ancres de voie 3D dans l'espace 3D et proposons une méthode sans BEV nommée Anchor3DLane pour prédire directement les voies 3D à partir des représentations FV. Les ancres de voie 3D sont projetées sur les caractéristiques FV afin d'en extraire des caractéristiques qui contiennent à la fois des informations structurelles et contextuelles de bonne qualité pour effectuer des prédictions précises. De plus, nous avons également développé une méthode d'optimisation globale qui utilise la propriété d'égalité de largeur entre les voies pour réduire l'erreur latérale des prédictions. Des expériences approfondies menées sur trois benchmarks populaires de détection de voies 3D montrent que notre méthode Anchor3DLane surpasses les méthodes précédentes basées sur BEV et atteint des performances d'état de l'art. Le code est disponible à l'adresse suivante : https://github.com/tusen-ai/Anchor3DLane.