VAD : Représentation Vectorielle de la Scène pour une Conduite Autonome Efficace

La conduite autonome nécessite une compréhension exhaustive de l'environnement environnant pour un tracé de trajectoire fiable. Les travaux précédents s'appuient sur une représentation de la scène en raster dense (par exemple, occupation des agents et carte sémantique) pour effectuer le tracé, ce qui est très exigeant en termes de calcul et manque d'informations structurées au niveau des instances. Dans cet article, nous proposons VAD, un paradigme vectoriel intégré pour la conduite autonome, qui modélise la scène de conduite sous forme de représentation entièrement vectorielle. Le paradigme vectoriel proposé présente deux avantages majeurs. D'une part, VAD utilise les mouvements vectoriels des agents et les éléments cartographiques comme contraintes explicites de planification au niveau des instances, ce qui améliore efficacement la sécurité du tracé. D'autre part, VAD fonctionne beaucoup plus rapidement que les méthodes de planification intégrée précédentes en se débarrassant de la représentation rasterisée exigeante en calcul et des étapes post-traitement conçues manuellement. VAD obtient des performances de planification intégrée d'avant-garde sur le jeu de données nuScenes, surpassant largement la meilleure méthode précédente. Notre modèle de base, VAD-Base, réduit considérablement le taux moyen de collisions de 29,0 % et fonctionne 2,5 fois plus rapidement. De plus, une variante allégée, VAD-Tiny, accélère considérablement la vitesse d'inférence (jusqu'à 9,3 fois) tout en atteignant des performances comparables en planification. Nous croyons que les excellentes performances et l'efficacité élevée de VAD sont cruciales pour le déploiement dans le monde réel d'un système de conduite autonome. Le code source et les modèles sont disponibles à l'adresse https://github.com/hustvl/VAD pour faciliter les recherches futures.