
摘要
尽管车道检测方法在真实场景中已展现出优异的性能,但大多数方法仍依赖于后处理步骤,而这些步骤往往缺乏足够的鲁棒性。为此,端到端检测器如检测变压器(Detection Transformer, DETR)被引入车道检测任务中。然而,DETR中采用的一对一标签分配机制由于存在标签语义冲突问题,会降低训练效率。此外,DETR中的位置查询(positional query)无法提供明确的位置先验信息,导致模型难以优化。本文提出一种新型的“一对多”Transformer架构——O2SFormer(One-to-Several Transformer)。首先,我们设计了一种“一对多”标签分配策略,融合了一对多与一对一分配机制,在保持端到端检测优势的同时,有效缓解了标签语义冲突问题。为克服一对一分配带来的优化困难,我们进一步提出了分层软标签(layer-wise soft label)机制,动态调整不同解码层中正样本车道锚点的正样本权重。最后,我们设计了基于动态锚点的位置查询方法,通过将车道锚点信息融入位置查询中,显式地探索空间位置先验。实验结果表明,采用ResNet50作为主干网络的O2SFormer在CULane数据集上取得了77.83%的F1分数,显著优于现有的基于Transformer和基于CNN的检测器。此外,相较于DETR,O2SFormer在使用ResNet18主干网络时,收敛速度提升了12.5倍。