
摘要
弱监督语义分割(WSSS)利用图像级标签等弱监督信息来训练分割模型。尽管近年来WSSS方法取得了令人印象深刻的成绩,但我们发现引入高平均交并比(mIoU)的弱标签并不一定能保证高的分割性能。现有研究强调了提高精度和减少噪声对于提升整体性能的重要性。基于这一思路,我们提出了一种针对WSSS的高级集成方法——ORANDNet。ORANDNet结合了来自两个不同分类器的类激活图(CAMs),以提高伪掩码(PMs)的精度。为了进一步减轻PMs中的小噪声,我们引入了课程学习策略。该策略首先使用较小尺寸的图像及其对应的PMs对分割模型进行训练,然后逐渐过渡到原始尺寸的图像对。通过结合ResNet-50和ViT的原始CAMs,我们在单个最佳模型和简单的集成模型上显著提升了分割性能。我们进一步将集成方法扩展到AMN(类似ResNet)和MCTformer(类似ViT)模型的CAMs,从而在先进的WSSS模型中实现了性能提升。这突显了我们的ORANDNet作为WSSS模型最终附加模块的潜力。