2 个月前
CurveFormer:基于曲线传播和注意力机制的3D车道检测
Bai, Yifeng ; Chen, Zhirong ; Fu, Zhangjie ; Peng, Lang ; Liang, Pengpeng ; Cheng, Erkang

摘要
三维车道检测是自动驾驶系统的重要组成部分。以往基于卷积神经网络(CNN)和变换器(Transformer)的方法通常首先从前视图图像生成鸟瞰图(BEV)特征图,然后利用以BEV特征图为输入的子网络预测三维车道。这些方法需要在BEV和前视图之间进行显式的视角转换,而这一问题本身仍然具有挑战性。本文中,我们提出了一种单阶段的基于变换器的方法——CurveFormer,该方法可以直接计算三维车道参数,从而绕过复杂的视角转换步骤。具体而言,我们将三维车道检测问题表述为曲线传播问题,通过使用曲线查询来实现。一个三维车道查询由一组动态且有序的锚点表示。通过这种方式,变换器解码器中的带有曲线表示的查询可以迭代地优化三维车道检测结果。此外,我们引入了一个曲线交叉注意力模块,用于计算曲线查询与图像特征之间的相似度。另外,还提供了一个上下文采样模块,该模块能够捕捉更多与曲线查询相关的图像特征,进一步提升三维车道检测性能。我们在合成数据集和真实世界数据集上对我们的方法进行了评估,实验结果表明,与现有最先进方法相比,我们的方法取得了令人鼓舞的性能表现。通过消融研究也验证了每个组件的有效性。