
摘要
近年来,最先进的半监督学习(Semi-Supervised Learning, SSL)方法通常以基于图像的变换与一致性正则化作为核心组件。然而,这类方法通常局限于简单的变换形式,例如传统的数据增强技术,或两张图像之间的凸组合。本文提出了一种新颖的、基于学习特征的精炼与增强方法,能够生成多样化且复杂的变换形式。尤为重要的是,这些变换充分利用了通过聚类提取的类内与类间原型表示信息。我们通过在内存库(memory bank)中存储迭代过程中已计算出的特征,避免了额外的大量计算开销。将这些特征驱动的复杂变换与传统的基于图像的增强方法相结合后,作为基于一致性的正则化损失的一部分。实验表明,本方法在较小数据集(如CIFAR-10和SVHN)上性能可与当前最先进方法相媲美;同时具备良好的可扩展性,适用于更大规模数据集(如CIFAR-100和mini-ImageNet),并在后两者上实现了显著超越现有技术水平的性能提升(例如,在mini-ImageNet上取得绝对提升17.44%)。此外,我们在DomainNet数据集上进一步验证了该方法对域外无标签数据的更强鲁棒性,并通过系统的消融实验与深入分析,充分验证了所提方法的有效性与合理性。