
摘要
编码器-解码器框架在离线语义图像分割领域处于领先地位。随着自主系统的兴起,实时计算变得越来越重要。本文介绍了一种快速分割卷积神经网络(Fast-SCNN),该模型能够在高分辨率图像数据(1024x2048像素)上实现超过实时的语义分割,并适用于低内存嵌入式设备上的高效计算。基于现有的双分支快速分割方法,我们引入了“学习降采样”模块,该模块能够同时为多个分辨率分支计算低级特征。我们的网络结合了高分辨率下的空间细节和低分辨率下提取的深层特征,从而在Cityscapes数据集上实现了每秒123.5帧、平均交并比为68.0%的性能。我们还证明了大规模预训练并非必要。通过使用ImageNet预训练和Cityscapes粗标签数据进行实验,我们对这一结论进行了充分验证。最后,我们在不修改网络结构的情况下,展示了在子采样输入上实现更快计算且具有竞争力的结果。