2 个月前

用于语义图像分割的带空洞可分离卷积的编码器-解码器结构

Liang-Chieh Chen; Yukun Zhu; George Papandreou; Florian Schroff; Hartwig Adam
用于语义图像分割的带空洞可分离卷积的编码器-解码器结构
摘要

在深度神经网络中,空间金字塔池化模块或编码器-解码器结构被用于语义分割任务。前者通过在多个尺度和多个有效视场下使用滤波器或池化操作来提取多尺度上下文信息,而后者则通过逐步恢复空间信息来捕捉更清晰的物体边界。在这项工作中,我们提出结合这两种方法的优势。具体而言,我们提出的模型DeepLabv3+是在DeepLabv3的基础上增加了一个简单而有效的解码器模块,以特别改善物体边界的分割结果。我们进一步研究了Xception模型,并将深度可分离卷积应用于空洞空间金字塔池化(Atrous Spatial Pyramid Pooling)和解码器模块,从而构建了一个更快更强的编码器-解码器网络。我们在PASCAL VOC 2012和Cityscapes数据集上展示了所提模型的有效性,在没有任何后处理的情况下,分别达到了89.0%和82.1%的测试集性能。我们的论文附带了一个公开的TensorFlow实现代码库,地址为:\url{https://github.com/tensorflow/models/tree/master/research/deeplab}。