HyperAIHyperAI
il y a 2 mois

Raisonnement topologique basé sur les graphes pour les scènes de conduite

Li, Tianyu ; Chen, Li ; Wang, Huijie ; Li, Yang ; Yang, Jiazhi ; Geng, Xiangwei ; Jiang, Shengyin ; Wang, Yuting ; Xu, Hang ; Xu, Chunjing ; Yan, Junchi ; Luo, Ping ; Li, Hongyang
Raisonnement topologique basé sur les graphes pour les scènes de conduite
Résumé

Comprendre le génome routier est essentiel pour réaliser la conduite autonome. Ce problème hautement intelligent comporte deux aspects : la relation de connexion des voies et la relation d'attribution entre les voies et les éléments de circulation, où une méthode de raisonnement topologique complète fait défaut. D'une part, les techniques précédentes d'apprentissage cartographique peinent à déduire la connectivité des voies avec des paradigmes de segmentation ou de lignes de voie ; ou bien, les approches orientées vers la topologie des voies se concentrent sur la détection des lignes centrales et négligent la modélisation des interactions. D'autre part, le problème d'attribution des éléments de circulation aux voies est limité au domaine des images, laissant le défi non exploré de construire une correspondance à partir de deux vues.Pour résoudre ces problèmes, nous présentons TopoNet, le premier cadre intégré capable d'abstraire les connaissances de circulation au-delà des tâches perceptive conventionnelles. Pour capturer la topologie de la scène de conduite, nous introduisons trois conceptions clés : (1) un module d'embedding pour intégrer les connaissances sémantiques des éléments 2D dans un espace de caractéristiques unifié ; (2) un réseau neuronal graphique de scène soigneusement conçu pour modéliser les relations et permettre l'interaction des caractéristiques au sein du réseau ; (3) plutôt que d'émettre des messages arbitrairement, un graphe de connaissances scéniques est élaboré pour différencier les connaissances a priori provenant des différents types du génome routier.Nous évaluons TopoNet sur le banc d'essai difficile d'OpenLane-V2 en matière de compréhension scénique, où notre approche surpassent toutes les œuvres précédentes avec une grande marge sur tous les métriques perceptives et topologiques. Le code est disponible à l'adresse suivante : https://github.com/OpenDriveLab/TopoNet