
摘要
尽管基于图像级弱监督语义分割(WSSS)的方法已取得显著进展,其核心依赖于类别激活图(Class Activation Maps, CAMs),但分类任务与分割任务之间仍存在较大的监督鸿沟,制约了模型生成更加完整且精确的伪掩码。针对这一问题,本文提出一种弱监督像素到原型对比学习方法(weakly-supervised pixel-to-prototype contrast),旨在提供像素级的监督信号,以缩小该监督差距。受两个直观先验的引导,该方法在图像的不同视图之间以及单个视图内部同时执行,旨在实现跨视图特征语义一致性正则化,并促进特征空间中类内紧凑性与类间分散性的优化。所提方法可无缝集成至现有WSSS模型中,无需修改基础网络结构,且不增加任何推理开销。大量实验结果表明,该方法显著提升了两种强基线模型的性能,充分验证了其有效性。具体而言,在SEAM基础上,我们将PASCAL VOC 2012数据集上的初始种子mIoU从55.4%提升至61.5%;此外,结合本方法后,EPS模型的分割mIoU由70.8%提升至73.6%,达到了新的最先进水平。