StyleDrive:全球首个个性化端到-end自动驾驶真实数据集问世,推动AI“像人一样驾驶”
Le projet StyleDrive, mené par le groupe de recherche du professeur Nie Zaiqing au Institut de recherche en intelligence artificielle de l’Université de Tsinghua (AIR), en collaboration avec l’Université King’s College de Londres, l’Université de Manchester et l’Université de Hong Kong, marque une avancée majeure dans le domaine de l’automatisation des véhicules : il s’agit du premier jeu de données à grande échelle et réel dans le monde dédié à l’automatisation embarquée personnalisée et à son évaluation systématique. Ce projet ouvre la voie à des systèmes de conduite autonome capables de reproduire des comportements humains différenciés selon les préférences individuelles — comme si le véhicule « connaissait » son conducteur. Alors que les modèles multimodaux à grande échelle (MLLMs) ont fait des progrès spectaculaires dans des tâches comme la reconnaissance d’images ou la compréhension vidéo, leur véritable capacité à raisonner et décider dans des environnements complexes reste largement limitée. Une étude récente menée par l’équipe du professeur Liu Yang (directeur adjoint de AIR), en partenariat avec les départements informatiques de Tsinghua et de Fudan, a mis en lumière ces lacunes via EscapeCraft — un environnement virtuel 3D de jeu de « fuite de chambre » conçu pour tester la capacité des modèles à résoudre des tâches complexes par raisonnement visuel. Les résultats ont été troublants : certains modèles voyaient la porte mais continuaient à tourner autour du mur ; ils ramassaient une clé sans savoir comment l’utiliser ; certains tentaient même de « saisir » un canapé en pensant qu’il pourrait cacher un secret. Ces erreurs ne sont pas isolées, mais systématiques : « voir » ne signifie pas « comprendre ». Même GPT-4o, modèle phare, réussit seulement quelques sous-tâches avec véritable compréhension, les autres étant des succès fortuits. Face à ces limites, StyleDrive répond à un besoin fondamental : fournir une base de données réelle et étiquetée pour entraîner et évaluer des systèmes d’automatisation embarquée personnalisée. Contrairement aux approches traditionnelles basées sur des architectures modulaires, souvent limitées à des scénarios simulés ou artificiels, StyleDrive s’appuie sur des données réelles de conduite en ville et en campagne, couvrant une grande variété de situations dynamiques. Le cœur du projet réside dans un cadre d’étiquetage hybride combinant règles explicites et compréhension contextuelle via des modèles visuels-linguistiques (VLM). Ce processus permet d’extraire des caractéristiques statiques (topologie routière) et dynamiques (mouvement du véhicule), puis d’analyser les comportements en lien avec des contextes sémantiques précis. Les préférences de conduite — « agressive », « prudente », « normale » — sont ainsi attribuées de manière objective et subjective, puis validées par des experts humains. Le jeu de données comprend plus de 10 000 trajets réels, avec une répartition des préférences montrant que 14,6 % des conducteurs sont agressifs et 5,5 % très prudents. Des visualisations montrent clairement que, dans des scénarios identiques, les trajectoires prédites par les modèles varient significativement selon les préférences imposées. Pour évaluer les performances, l’équipe a développé le StyleDrive Benchmark, un environnement de simulation basé sur des scènes réelles, et introduit un nouvel indicateur : le SM-PDMS (Style-Modulated Predictive Driver Model Score). Ce score intègre non seulement des critères de sécurité et de conformité, mais aussi une mesure d’alignement comportemental avec la préférence du conducteur. Des paramètres comme la tolérance à l’inconfort, la décision d’avancer ou le seuil de risque sont ajustés dynamiquement selon le style. Les expérimentations sur quatre architectures E2EAD montrent que l’ajout d’un contrôle par style améliore fortement l’alignement comportemental, la fluidité et la fidélité aux comportements humains. Des comparaisons qualitatives confirment que les modèles peuvent produire des trajectoires clairement agressives, prudentes ou normales, en fonction de la condition d’entrée. En somme, StyleDrive constitue une avancée fondamentale : premier jeu de données réel à grande échelle pour l’automatisation embarquée personnalisée, premier cadre d’évaluation standardisé, et première preuve expérimentale que l’IA peut « conduire comme un humain » — non pas de manière uniforme, mais en s’adaptant à des personnalités. Ce travail, accepté en communication orale à AAAI 2026, ouvre la voie à des systèmes plus humains, plus sûrs et plus intuitifs.
