2 个月前

用于街景语义分割的全分辨率残差网络

Tobias Pohlen; Alexander Hermans; Markus Mathias; Bastian Leibe
用于街景语义分割的全分辨率残差网络
摘要

语义图像分割是现代自动驾驶系统中的一个重要组成部分,因为对周围场景的准确理解对于导航和行动规划至关重要。当前最先进的语义图像分割方法依赖于最初为整体图像分类而开发的预训练网络。尽管这些网络在识别性能(即可见物体是什么)方面表现出色,但在定位精度(即物体具体位于何处)方面却有所欠缺。因此,为了获得全分辨率图像的像素级精确分割掩模,需要进行额外的处理步骤。为了解决这一问题,我们提出了一种新型的类似ResNet的架构,该架构在定位和识别性能方面表现出色。通过在网络中使用两个处理流,我们将多尺度上下文与像素级精度相结合:一个流携带全分辨率图像的信息,从而实现对分割边界的精确遵循;另一个流经过一系列池化操作以获取稳健的识别特征。这两个流在全分辨率下通过残差连接进行耦合。无需额外的处理步骤且无需预训练,我们的方法在Cityscapes数据集上达到了71.8%的交并比分数。

用于街景语义分割的全分辨率残差网络 | 最新论文 | HyperAI超神经