DiFSD : Paradigme Égo-Centrique Pleinement Épars avec Débruitage d'Incertitude et Affinage Itératif pour une Conduite Autonome Efficace et Intégrée

Les méthodes actuelles de conduite autonome de bout en bout recourent à l'unification des conceptions modulaires pour diverses tâches (par exemple, la perception, la prédiction et la planification). Bien que ces systèmes soient optimisés dans une perspective orientée vers la planification avec un cadre entièrement différentiable, les systèmes de conduite autonome de bout en bout existants sans conception égocentrique souffrent encore d'une performance insatisfaisante et d'une efficacité inférieure, en raison de l'apprentissage de représentations scéniques rasterisées et de la transmission d'informations redondantes. Dans cet article, nous réexaminons le comportement humain lors de la conduite et proposons un paradigme entièrement éparse et égocentrique, nommé DiFSD, pour la conduite autonome de bout en bout. Plus précisément, DiFSD se compose principalement d'un module de perception éparse, d'un module d'interaction hiérarchique et d'un planificateur de mouvement itératif. Le module de perception éparse effectue la détection, le suivi et la cartographie en ligne basés sur une représentation éparse du scénario de conduite. Le module d'interaction hiérarchique vise à sélectionner le Véhicule / Station Statique le Plus Proche sur le Parcours (CIPV / CIPS) d'une manière grossière à fine, bénéficiant d'un a priori géométrique supplémentaire. Quant au planificateur de mouvement itératif, il prend en compte à la fois les agents interactifs sélectionnés et le véhicule égo pour une prédiction conjointe du mouvement, où les trajectoires égo multi-modales sont optimisées par itération. De plus, une diffusion du mouvement au niveau positionnel et un débruitage au niveau trajectoriel sont introduits pour modéliser l'incertitude, facilitant ainsi la stabilité et la convergence de l'ensemble du cadre. Des expériences approfondies menées sur les jeux de données nuScenes et Bench2Drive démontrent les performances supérieures en planification et l'efficacité remarquable de DiFSD.