HyperAIHyperAI
il y a 7 jours

DiffAD : Une Approche Unifiée de Modélisation par Diffusion pour la Conduite Autonome

Tao Wang, Cong Zhang, Xingguang Qu, Kun Li, Weiwei Liu, Chang Huang
DiffAD : Une Approche Unifiée de Modélisation par Diffusion pour la Conduite Autonome
Résumé

Le pilotage autonome bout-à-bout (E2E-AD) s’est rapidement imposé comme une approche prometteuse vers l’atteinte de l’autonomie totale. Toutefois, les systèmes E2E-AD existants adoptent généralement une architecture classique multi-tâches, traitant séparément les tâches de perception, de prédiction et de planification à l’aide de sous-réseaux spécifiques à chaque tâche. Bien qu’entraînés de manière entièrement différentiable, ces systèmes souffrent encore de problèmes de coordination entre les tâches, tout en maintenant une complexité systémique élevée. Dans ce travail, nous introduisons DiffAD, un nouveau modèle probabiliste par diffusion qui repense le pilotage autonome comme une tâche de génération d’image conditionnelle. En rasterisant les objets hétérogènes sur une vue en plan unifiée (BEV) et en modélisant leur distribution latente, DiffAD unifie divers objectifs de conduite et optimise conjointement toutes les tâches de conduite au sein d’un seul cadre, réduisant significativement la complexité du système et améliorant la coordination entre les tâches. Le processus inverse itératif affine progressivement l’image BEV générée, conduisant à des comportements de conduite plus robustes et plus réalistes. Des évaluations en boucle fermée dans Carla démontrent l’efficacité de la méthode proposée, atteignant un nouveau record en taux de succès et en score de conduite. Le code sera rendu disponible publiquement.

DiffAD : Une Approche Unifiée de Modélisation par Diffusion pour la Conduite Autonome | Articles de recherche récents | HyperAI