17 天前

用于语义分割的双图卷积网络

Li Zhang, Xiangtai Li, Anurag Arnab, Kuiyuan Yang, Yunhai Tong, Philip H.S. Torr
用于语义分割的双图卷积网络
摘要

在像素级预测任务(如语义分割)中,利用长距离上下文信息至关重要。与以往采用多尺度特征融合或空洞卷积的方法不同,本文提出一种新颖的图卷积网络(GCN)来解决该问题。我们提出的双图卷积网络(Dual Graph Convolutional Network, DGCNet)在一个统一框架中建模两种正交图结构,以捕捉输入特征的全局上下文信息。第一部分建模图像中像素之间的空间关系,第二部分则建模网络特征图在通道维度上的相互依赖性。该方法通过将特征投影至低维新空间,在该空间中高效建模所有成对交互关系,再将结果重新投影回原始空间,从而实现高效计算。所提出的简洁方法在强基线基础上显著提升性能,并在Cityscapes数据集(平均交并比达82.0%)和Pascal Context数据集(平均交并比达53.7%)上均取得了当前最优的实验结果。相关代码与模型已公开,以促进后续研究(\url{https://github.com/lxtGH/GALD-DGCNet})。