
摘要
当前最先进的图像分割方法形成了一个密集的图像表示,其中颜色、形状和纹理信息都在深度卷积神经网络(CNN)中一起处理。然而,这种方法可能并不理想,因为这些信息对于识别来说具有非常不同的类型。在此,我们提出了一种新的双流CNN架构用于语义分割,该架构显式地将形状信息作为单独的处理分支(即形状流),与经典流并行处理信息。该架构的关键是一种新型门控机制,用于连接两个流的中间层。具体而言,我们利用经典流中的高层次激活来门控形状流中的低层次激活,从而有效去除噪声,并帮助形状流仅专注于处理与边界相关的信息。这使得我们可以为形状流使用一个非常浅的架构,在图像级分辨率上进行操作。我们的实验表明,这种架构能够产生更加锐利的对象边界预测,并显著提高了对细小和小型对象的性能。我们的方法在Cityscapes基准测试中取得了最佳性能,无论是在掩膜质量(mIoU)还是边界质量(F-score)方面,相比强大的基线模型分别提升了2%和4%。