HyperAIHyperAI
il y a 17 jours

TopoBDA : Vers une attention déformable de type Bézier pour la compréhension de la topologie routière

Muhammet Esat Kalfaoglu, Halil Ibrahim Ozturk, Ozsel Kilinc, Alptekin Temizel
TopoBDA : Vers une attention déformable de type Bézier pour la compréhension de la topologie routière
Résumé

La compréhension de la topologie routière est essentielle pour les véhicules autonomes. Ce papier présente TopoBDA (Topology with Bezier Deformable Attention), une nouvelle approche qui améliore la compréhension de la topologie routière en exploitant l’attention déformable à points de contrôle de Bézier (Bezier Deformable Attention, BDA). TopoBDA traite des images issues de plusieurs caméras en 360 degrés afin de générer des caractéristiques en vue de dessus (Bird’s Eye View, BEV), lesquelles sont ensuite affinées par un décodeur transformer utilisant la BDA. La BDA utilise des points de contrôle de Bézier pour piloter le mécanisme d’attention déformable, améliorant ainsi la détection et la représentation des structures linéaires allongées et fines, telles que les lignes centrales des voies. En outre, TopoBDA intègre deux composants auxiliaires : une perte fondée sur une formulation de masque d’instances et une stratégie de perte de prédiction un-à-plusieurs, afin d’affiner davantage la détection des lignes centrales et d’améliorer la compréhension de la topologie routière. Les évaluations expérimentales sur le jeu de données OpenLane-V2 montrent que TopoBDA surpasse les méthodes existantes, atteignant des résultats de pointe en détection des lignes centrales et en raisonnement topologique. TopoBDA obtient également les meilleurs résultats sur le jeu de données OpenLane-V1 pour la détection en 3D des voies. Des expériences supplémentaires sur l’intégration de données multimodales — telles que LiDAR, radar et SDMap — démontrent que l’utilisation de données multimodales peut encore renforcer les performances en compréhension de la topologie routière.