7 天前
SparseDrive:通过稀疏场景表征实现端到端自动驾驶
Wenchao Sun, Xuewu Lin, Yining Shi, Chuang Zhang, Haoran Wu, Sifa Zheng

摘要
成熟的模块化自动驾驶系统将任务分解为独立的子模块,如感知、预测与规划等,但这种解耦架构容易导致信息丢失和误差在各模块间累积。相比之下,端到端范式将多任务统一于一个完全可微的框架中,实现了以规划为导向的整体优化。尽管端到端方法具有巨大潜力,但现有方法在性能与效率方面仍不尽如人意,尤其是在规划安全性方面表现不足。我们认为,这一问题主要源于计算开销较大的鸟瞰图(Bird's Eye View, BEV)特征表示,以及预测与规划模块设计上的简单化。为此,我们探索了稀疏表征方法,并重新审视了端到端自动驾驶的任务设计,提出了一种名为 SparseDrive 的新范式。具体而言,SparseDrive 由一个对称的稀疏感知模块与一个并行的运动规划器组成。稀疏感知模块采用对称的模型架构,统一完成目标检测、跟踪与在线建图任务,学习驾驶场景的全稀疏表征。在运动预测与规划方面,我们深入分析了二者之间的高度相似性,从而设计了并行的运动规划结构。基于该并行架构,将规划问题建模为多模态问题,我们进一步提出一种分层规划选择策略,其中引入了具备碰撞感知能力的重评分模块,以筛选出合理且安全的最终规划轨迹。得益于上述高效设计,SparseDrive 在各项任务上的性能显著超越现有最先进方法,同时在训练与推理效率方面也实现了大幅提升。代码将开源至 https://github.com/swc-17/SparseDrive,以促进后续研究的发展。