
摘要
半监督学习是一个具有挑战性的问题,其目标是利用有限数量的标注样本构建有效模型。针对该问题,已有大量方法被提出,其中大多数方法主要通过利用未标注样本预测结果的一致性来正则化网络。然而,将标注数据与未标注数据分开处理往往导致大量从标注样本中学习到的先验知识被忽略,并且难以挖掘标注与未标注图像对之间的特征交互关系。本文提出了一种新颖的半监督语义分割方法——GuidedMix-Net,通过利用标注信息来引导未标注样本的学习过程。具体而言,我们首先引入一种标注数据与未标注数据之间的特征对齐目标,以捕捉潜在相似的图像对,并基于这些图像对生成混合输入。在此基础上,我们提出了一种基于聚类假设的互信息迁移机制(Mutual Information Transfer, MITrans),该机制被证明是一种强大的知识模块,能够有效促进在混合数据空间中对未标注数据特征的逐步精细化优化。为进一步利用标注样本并引导未标注数据的学习,我们还设计了一个掩码生成模块,用于为未标注数据生成高质量的伪掩码。在对标注数据进行监督学习的同时,未标注数据的预测结果与从混合数据中生成的伪掩码进行联合优化。在PASCAL VOC 2012、PASCAL-Context和Cityscapes三个基准数据集上的大量实验表明,所提出的GuidedMix-Net方法具有显著有效性,其分割精度达到竞争性水平,并相较于此前最先进的方法,将平均交并比(mIoU)提升了高达+7%。