
摘要
尽管数据资源丰富,但数据标注成本高昂。半监督学习方法通过结合少量标注样本与大量未标注数据,能够高效地训练模型。本文提出了一种名为LiDAM的半监督学习方法,该方法融合了领域自适应(domain adaptation)与自 paced 学习(self-paced learning)的思想。LiDAM首先通过局部领域偏移(localized domain shifts)操作,提取更具领域不变性的特征,从而提升聚类的准确性并生成更可靠的伪标签。随后,采用一种基于高置信度预测中多数一致性原则的新型迭代匹配技术,以自 paced 的方式将伪标签与真实类别标签进行对齐。与此同时,一个最终分类器被持续训练,直至收敛,以预测真实标签。在CIFAR-100数据集上,LiDAM取得了当前最优的性能表现,在仅使用2500个标注样本的情况下,准确率达到了73.50%,显著优于FixMatch方法的71.82%。