HyperAIHyperAI
il y a 2 mois

MapTR : Modélisation et apprentissage structurés pour la construction en ligne de cartes HD vectorisées

Liao, Bencheng ; Chen, Shaoyu ; Wang, Xinggang ; Cheng, Tianheng ; Zhang, Qian ; Liu, Wenyu ; Huang, Chang
MapTR : Modélisation et apprentissage structurés pour la construction en ligne de cartes HD vectorisées
Résumé

La carte haute définition (HD) fournit une abondance d'informations environnementales précises de la scène de conduite, constituant un élément fondamental et indispensable pour la planification dans les systèmes de conduite autonome. Nous présentons MapTR, une structure de Transformer bout à bout optimisée pour la construction efficace en ligne de cartes vectorisées HD. Nous proposons une approche unifiée de modélisation équivalente par permutation, c'est-à-dire la modélisation d'un élément de carte comme un ensemble de points avec un groupe de permutations équivalentes, qui décrit précisément la forme de l'élément de carte et stabilise le processus d'apprentissage. Nous concevons un schéma d'incrustation hiérarchique des requêtes pour encoder flexiblement les informations structurées de la carte et effectuer un appariement bipartite hiérarchique pour l'apprentissage des éléments de carte. MapTR obtient les meilleures performances et efficacités parmi les approches existantes de construction vectorisée de cartes HD sur le jeu de données nuScenes, en utilisant uniquement des entrées caméra. En particulier, MapTR-nano fonctionne à une vitesse d'inférence temps réel (25,1 FPS) sur RTX 3090, soit 8 fois plus rapide que la méthode basée sur caméra existante la plus avancée tout en atteignant un mAP 5,0 points plus élevé. Même comparé à la méthode multi-modalité existante la plus avancée, MapTR-nano obtient un mAP 0,7 point plus élevé, tandis que MapTR-tiny atteint un mAP 13,5 points plus élevé et une vitesse d'inférence 3 fois plus rapide. De nombreux résultats qualitatifs montrent que MapTR maintient une qualité stable et robuste dans des scènes de conduite complexes et variées. MapTR présente une grande valeur pratique pour la conduite autonome. Le code source et davantage de démonstrations sont disponibles à l'adresse \url{https://github.com/hustvl/MapTR}.