
摘要
端到端自动驾驶(End-to-end Autonomous Driving, E2E-AD)正迅速成为实现完全自动驾驶的有前景技术路径。然而,现有的E2E-AD系统通常采用传统的多任务框架,通过独立的任务专用分支分别处理感知、预测与规划任务。尽管这些系统以全可微分的方式进行训练,但仍面临任务协调困难的问题,且系统整体复杂度较高。在本研究中,我们提出DiffAD——一种新型扩散概率模型,将自动驾驶重新定义为一个条件图像生成任务。通过将异构的交通目标统一栅格化至鸟瞰图(Bird’s-Eye View, BEV)空间,并建模其潜在分布,DiffAD实现了多种驾驶目标的统一表达,并在单一框架内联合优化所有驾驶任务,显著降低了系统复杂度,同时有效协调了各任务之间的关系。其逆向生成过程通过迭代优化逐步细化生成的BEV图像,从而产生更具鲁棒性与真实感的驾驶行为。在Carla平台上的闭环评估结果表明,所提方法性能优越,达到了新的最先进水平,成功提升了成功率(Success Rate)与驾驶评分(Driving Score)。相关代码将公开发布。