
摘要
卷积神经网络(CNN)通常通过逐层堆叠卷积操作来构建。尽管CNN在从原始像素中提取语义方面表现出强大的能力,但其对图像行和列之间像素空间关系的捕捉尚未得到充分探索。这些关系对于学习具有强烈形状先验但外观一致性较弱的语义对象尤为重要,例如交通标线,它们经常被遮挡或甚至未在路面上绘制,如图1(a)所示。本文中,我们提出了一种空间卷积神经网络(SCNN),该网络将传统的深层逐层卷积推广到特征图内的逐片卷积,从而实现在一层内行和列之间像素的消息传递。这种SCNN特别适用于具有强烈空间关系但外观线索较少的长连续形状结构或大对象,如交通标线、杆子和墙壁。我们将SCNN应用于一个新发布的极具挑战性的交通标线检测数据集以及Cityscapes数据集上。实验结果表明,SCNN能够学习结构输出的空间关系,并显著提高了性能。我们在车道检测数据集上的实验显示,SCNN分别比基于递归神经网络(RNN)的ReNet和MRF+CNN(MRFNet)高出8.7%和4.6%的性能。此外,我们的SCNN在TuSimple基准车道检测挑战赛中获得了第一名,准确率达到96.53%。