
摘要
当前的端到端自动驾驶方法倾向于将各种任务(如感知、预测和规划)统一为模块化设计。尽管在完全可微框架下以规划为导向进行了优化,但现有的端到端驾驶系统由于缺乏以自我为中心的设计,仍然存在性能不佳和效率低下的问题,这主要是由于栅格化的场景表示学习和冗余的信息传输所致。本文重新审视了人类驾驶行为,并提出了一种以自我为中心的全稀疏范式,称为DiFSD(Differential Fully Sparse Driving),用于端到端自动驾驶。具体而言,DiFSD主要由稀疏感知模块、层次交互模块和迭代运动规划器组成。稀疏感知模块基于驾驶场景的稀疏表示执行检测、跟踪和在线建图。层次交互模块旨在从粗到细选择路径中的最近车辆/静止物体(CIPV/CIPS),得益于额外的几何先验知识。对于迭代运动规划器,所选的交互代理和自车均被考虑进行联合运动预测,其中输出的多模态自车轨迹通过迭代方式进行优化。此外,引入了位置级运动扩散和轨迹级规划去噪来建模不确定性,从而有助于整个框架的训练稳定性和收敛性。在nuScenes和Bench2Drive数据集上进行的大量实验表明,DiFSD具有优越的规划性能和高效的运行效果。