
摘要
现有基于图像级弱监督的弱监督语义分割(WSSS)研究存在若干局限性,包括目标物体覆盖稀疏、物体边界定位不准确,以及非目标物体共现像素的干扰问题。为克服上述挑战,本文提出一种新颖的框架——显式伪像素监督(Explicit Pseudo-pixel Supervision, EPS),该框架通过融合两种弱监督信号,实现像素级反馈的学习:图像级标签通过定位图(localization map)提供目标类别信息,而基于现成显著性检测模型生成的显著图(saliency map)则提供丰富的边界线索。我们设计了一种联合训练策略,充分挖掘两种信息之间的互补关系。所提方法能够生成更为精确的物体边界,并有效剔除共现的非目标像素,从而显著提升伪掩码(pseudo-mask)的质量。实验结果表明,该方法在解决WSSS关键难题方面表现卓越,在PASCAL VOC 2012与MS COCO 2014两个基准数据集上均取得了新的最先进性能(state-of-the-art)。