
摘要
在弱监督语义分割(Weakly Supervised Semantic Segmentation, WSSS)中,类激活图(Class Activation Maps, CAMs)通常存在两个问题:一是无法完整覆盖目标物体,二是会在无关区域产生误激活。为解决上述问题,我们提出了一种基于分类器与图像重构器对抗学习的新型WSSS框架。当一张图像被精确地分解为各个类别对应的语义区域时,某一区域所包含的信息(如颜色或纹理)无法从其他区域中推断出来。因此,各区域之间的可推断性可作为分割精确度的度量标准。我们通过量化某一区域从其他区域中重构的质量来衡量这种可推断性:若某一区域能够被其他区域重构,则说明该区域的分割不够精确。为将该思想应用于WSSS任务,我们同时训练两个模型:一个用于生成CAMs的分类器,将图像分解为类别相关的区域;另一个为重构器,用于衡量各区域之间的可推断性。类似于生成对抗网络(GANs)的机制,两个网络以对抗方式交替训练,彼此提供正向反馈,从而协同提升分割质量。通过大量消融实验,我们验证了所提框架的优越性。在PASCAL VOC 2012和MS COCO 2014两个标准数据集上,我们的方法均取得了新的最先进(state-of-the-art)性能。代码已开源,地址为:https://github.com/sangrockEG/ACR。