HyperAIHyperAI

Command Palette

Search for a command to run...

全球首个个性化端到端自动驾驶数据集StyleDrive问世 清华大学智研院引领真实世界评测新标准

清华大学智能产业研究院(AIR)聂再清教授课题组联合伦敦国王学院、曼彻斯特大学与香港大学,发布了全球首个面向个性化端到端自动驾驶的大规模真实世界数据集与评测体系——StyleDrive。该成果被人工智能顶会AAAI 2026录用并作口头报告,标志着个性化自动驾驶研究迈入新阶段。 当前,尽管多模态大模型在图像理解、视频推理等方面取得显著进展,但在复杂环境下的真实推理能力仍存在“看见不代表理解”的系统性缺陷。为此,AIR执行院长刘洋教授团队联合清华大学计算机系、复旦大学推出3D密室逃脱环境EscapeCraft,用于评估大模型在真实视觉场景中完成多步骤任务的推理能力。测试发现,即使GPT-4o等先进模型也常出现“绕墙走门”“捡钥匙不会用”“想抓沙发找暗格”等明显误判,暴露出模型对环境语义理解的局限。 针对自动驾驶领域,StyleDrive首次构建了真实世界中大规模、高精度的个性化驾驶倾向数据集。该数据集覆盖城市与乡村多种道路场景,通过融合规则分析与视觉语言模型(VLM)的场景理解能力,实现对驾驶者“激进”“保守”“稳健”等风格偏好的客观与主观双重标注。其中,激进与保守倾向分别占比14.6%和5.5%,数据经过人工校核,确保标签可靠性。 为推动研究落地,团队同步推出StyleDrive Benchmark仿真评测平台,引入SM-PDMS(Style-Modulated Predictive Driver Model Score)指标体系,在传统安全与合规性基础上,新增“舒适度容忍度”“前进度”“碰撞时间范围”等反映驾驶风格的维度,实现对模型行为与用户偏好对齐程度的量化评估。 实验表明,引入驾驶倾向作为条件输入后,E2EAD模型在行为一致性、可控性与人类行为相似度上均显著提升。在相同场景下,模型能根据设定倾向生成明显差异的轨迹,实现“激进变道”“保守跟车”等类人行为,有效避免了传统模型“平均化”驾驶的弊端。 StyleDrive不仅填补了个性化端到端自动驾驶在真实数据与评测标准上的空白,更构建了“数据—标注—评估”全链条体系,为未来以人为本的智能驾驶发展提供了坚实基础。团队指出,个性化与安全、可解释性之间的平衡,仍是未来值得深入探索的方向。

相关链接