17 天前

TopoBDA:面向道路拓扑理解的贝塞尔可变形注意力

Muhammet Esat Kalfaoglu, Halil Ibrahim Ozturk, Ozsel Kilinc, Alptekin Temizel
TopoBDA:面向道路拓扑理解的贝塞尔可变形注意力
摘要

道路拓扑结构的理解对于自动驾驶系统至关重要。本文提出了一种名为TopoBDA(基于贝塞尔可变形注意力的道路拓扑建模)的新方法,通过引入贝塞尔可变形注意力(Bezier Deformable Attention, BDA)机制,显著提升了对道路拓扑结构的感知能力。TopoBDA利用多摄像头360度视觉图像生成鸟瞰图(Bird’s Eye View, BEV)特征,并通过采用BDA机制的Transformer解码器对这些特征进行精细化处理。BDA机制利用贝塞尔控制点驱动可变形注意力机制,有效提升了对细长线状结构(如车道中心线)的检测与表征能力。此外,TopoBDA还引入了两项辅助组件:实例掩码形式化损失(instance mask formulation loss)和一对多集合预测损失策略(one-to-many set prediction loss strategy),进一步优化了车道中心线的检测精度,增强了对道路拓扑关系的理解能力。在OpenLane-V2数据集上的实验评估表明,TopoBDA在车道中心线检测与拓扑推理任务中均优于现有方法,达到了当前最优(state-of-the-art)性能。同时,在OpenLane-V1数据集上的3D车道线检测任务中,TopoBDA也取得了最佳结果。进一步的多模态融合实验表明,引入LiDAR、雷达(radar)及语义地图(SDMap)等多源信息可进一步提升道路拓扑理解的性能,验证了多模态感知在复杂场景下的优势。