
摘要
无监督域自适应(Unsupervised Domain Adaptation, UDA)旨在通过将源域(拥有大量标注数据)的知识迁移至目标域(无标注数据),从而克服对大规模标注数据集的依赖。由于目标域中缺乏真实标签,早期的域间分布错位可能在后续训练阶段持续累积,导致误差不断放大。为缓解这一问题,本文提出一种渐进式源域扩展(Gradual Source Domain Expansion, GSDE)算法。GSDE通过多次从零开始训练UDA任务实现,每次均重新初始化网络权重,但逐步将目标域数据纳入源域数据集。具体而言,前一轮训练中得分最高的目标域样本被作为伪源样本(pseudo-source samples),并赋予相应的伪标签。该策略使得新训练阶段从一开始就可直接利用前一轮学习到的知识,从而显著提升源域与目标域之间的对齐效果,尤其在训练初期表现更为突出。在本研究中,我们首先构建了一个性能强大的基线网络,并在此基础上应用GSDE策略。我们在三个主流基准数据集(Office-31、Office-Home和DomainNet)上进行了大量实验与消融研究,结果表明,所提方法在各项指标上均优于现有最先进方法。此外,我们进一步验证了GSDE策略具有良好的泛化能力,可有效提升多种不同前沿UDA方法的性能。