2 个月前

重新思考用于语义图像分割的空洞卷积

Chen, Liang-Chieh ; Papandreou, George ; Schroff, Florian ; Adam, Hartwig
重新思考用于语义图像分割的空洞卷积
摘要

在这项工作中,我们重新审视了空洞卷积(atrous convolution),这是一种强大的工具,可以显式地调整滤波器的视野范围以及控制由深度卷积神经网络计算的特征响应的分辨率,应用于语义图像分割。为了处理多尺度物体分割的问题,我们设计了模块,这些模块通过级联或并行使用空洞卷积来捕捉多尺度上下文,采用了多种空洞率。此外,我们提出增强我们之前提出的空洞空间金字塔池化(Atrous Spatial Pyramid Pooling)模块,该模块在多个尺度上探测卷积特征,并加入图像级别的特征以编码全局上下文,从而进一步提升性能。我们还详细介绍了实现细节,并分享了训练系统的经验。所提出的“DeepLabv3”系统在没有密集条件随机场(DenseCRF)后处理的情况下显著优于我们之前的DeepLab版本,并在PASCAL VOC 2012语义图像分割基准测试中达到了与其他最先进模型相当的性能。