HyperAIHyperAI

Command Palette

Search for a command to run...

Erster realer Datensatz für personalisierte autonome Fahrt von THU

清华大学智能产业研究院(AIR)聂再清教授团队联合伦敦国王学院、曼彻斯特大学与香港大学,推出全球首个面向个性化端到端自动驾驶的真实世界数据集与评测体系——StyleDrive。该成果被人工智能顶会AAAI 2026录用并作Oral报告,标志着个性化自动驾驶研究迈入真实世界数据驱动的新阶段。传统自动驾驶系统多采用模块化架构,虽能实现部分个性化定制,但依赖模拟环境或人工设计,难以在复杂动态交通中泛化。而端到端自动驾驶(E2EAD)虽具更强整合性与泛化潜力,却长期忽视用户驾驶风格差异,导致行为趋于“平均化”,缺乏人类驾驶的多样性与个性特征。 为突破这一瓶颈,StyleDrive首次构建了大规模真实道路驾驶数据集,涵盖城市与乡村多种典型场景,通过融合规则与场景理解的双轨标注框架,实现对驾驶倾向的精准标注。该框架结合静态道路拓扑与动态车辆轨迹,利用微调的视觉语言模型(VLM)解析场景语义,结合行为分布分析与规则启发法生成客观倾向标签,并通过VLM联合建模主观偏好,最终经人工校验确保标签质量。数据显示,激进与保守驾驶倾向分别占14.6%和5.5%,真实反映个体差异。 在此基础上,研究团队开发了StyleDrive Benchmark——首个基于真实场景的仿真评估平台,引入SM-PDMS(Style-Modulated Predictive Driver Model Score)指标体系,在传统安全与合规性基础上,新增“行为对齐”维度,通过动态调整舒适度容忍度、前车跟车果断性与碰撞时间阈值,量化模型对不同驾驶风格的响应能力。在四种主流E2EAD架构中引入倾向条件控制后,实验表明,模型在倾向对齐度、行为一致性与人类轨迹接近度上均显著提升。定性结果显示,相同场景下,模型能根据激进、正常、保守等不同倾向生成明显差异的轨迹,且与真实人类驾驶行为高度吻合。 该工作不仅填补了个性化E2EAD在真实数据与评测标准上的空白,更揭示了当前大模型在复杂环境推理中的根本局限——“看见不等于理解”。此前刘洋教授团队推出的EscapeCraft研究也显示,即便GPT-4o等先进模型在密室逃脱任务中也常出现逻辑断裂、动作脱节等问题,暴露出多模态大模型在空间推理与任务规划上的系统性缺陷。StyleDrive的出现,为解决此类问题提供了可量化的数据基础与评估路径。 业内专家认为,StyleDrive的发布标志着自动驾驶正从“通用化”向“人格化”演进。其融合真实数据、可解释标注与可比性评测的完整体系,为未来人机共驾、智能座舱个性化服务等应用奠定了关键基础。未来,随着驾驶风格建模、跨场景泛化与安全约束协同优化的深入,个性化E2EAD有望真正实现“像人一样驾驶”的智能愿景。

Verwandte Links