
摘要
半监督语义分割要求模型能够有效地将少量标注图像中的标签信息传播至大量未标注图像中。此类像素级预测任务面临的一个关键挑战是类内差异较大,即同一类别内的区域在图像中可能呈现出截然不同的外观特征。这种多样性使得标签从像素到像素的传播变得极为困难。为解决这一问题,我们提出一种新方法,通过规范化类内特征的分布来缓解标签传播的难度。具体而言,该方法促使线性预测器的输出与基于原型的预测器输出保持一致性,从而隐式地促使同一伪类别下的特征靠近至少一个类内原型,同时远离其他类别的原型。在此基础上,进一步引入CutMix数据增强策略以及一种精心设计的原型维护机制,我们构建了一种半监督语义分割算法。在Pascal VOC与Cityscapes两个基准数据集上的大量实验评估表明,该方法在性能上显著优于现有最先进方法。