
摘要
本文研究了语义分割的半监督学习方法,该方法假设训练图像中仅有少量样本带有标签,其余样本均未标注。通常,未标注图像会被赋予伪标签以用于训练,但这一过程往往因伪标签中的错误被持续强化而引发性能下降的问题,即所谓的“确认偏差”(confirmation bias)。为此,本文提出了一种新颖的方法,有效解决了伪标签机制长期存在的这一核心问题。该方法的核心是误差定位网络(Error Localization Network, ELN),这是一种辅助模块,输入为原始图像及其对应的分割预测结果,能够识别出伪标签可能错误的像素区域。通过在训练过程中忽略这些被识别为错误的标签噪声,ELN显著提升了半监督学习对不准确伪标签的鲁棒性,并可自然地与自训练(self-training)和对比学习(contrastive learning)等策略相结合。此外,本文还提出了一种针对ELN的新颖训练策略,在ELN训练过程中模拟真实且多样化的分割错误,从而增强其泛化能力。实验在PASCAL VOC 2012和Cityscapes两个基准数据集上进行,结果表明,所提方法在所有评估设置下均优于现有各类方法。