
摘要
弱监督方法通常基于分类网络生成的注意力图来产生定位结果。然而,这些注意力图仅突出显示了目标物体最具区分性的部分,这些部分往往较小且分布稀疏。为此,我们提出生成自产引导(Self-produced Guidance, SPG)掩模,以分离前景(即感兴趣的物体)和背景,为分类网络提供像素的空间相关性信息。我们提出了一种分阶段的方法,通过结合高置信度的目标区域来学习SPG掩模。在注意力图中利用高置信度区域逐步学习SPG掩模。然后,这些掩模作为辅助的像素级监督信息,促进分类网络的训练。我们在ILSVRC数据集上进行了大量实验,结果表明SPG在生成高质量的目标定位图方面是有效的。特别是,所提出的SPG在ILSVRC验证集上达到了43.83%的Top-1定位错误率,这是目前最新的最佳错误率。