
摘要
部分域适应(Partial Domain Adaptation, PDA)近年来受到广泛关注,其假设目标域的标签空间是源域标签空间的子集。由于源域与目标域之间存在标签空间差异,直接对齐两个域在PDA中面临较大挑战。为解决这一问题,本文提出一种选择性部分域适应(Selective Partial Domain Adaptation, SPDA)方法,通过筛选有助于目标域适应的有用数据来提升性能。具体而言,我们首先设计了一种专为PDA任务定制的最大余弦相似度(Maximum of Cosine, MoC)函数,用于从源域中选择与目标域样本具有较高相似性的有用数据,从而减小域间差异。在MoC相似度函数中,针对每个目标域样本,选择源域中余弦相似度最大的样本进行对齐与适应。此外,我们还提出一种选择性训练策略,用于将高质量的目标域数据逐步引入源域进行联合学习。该策略首先采用自训练(self-training)方法为目标域样本分配伪标签,随后将伪标签置信度较高的目标样本加入源域,以增强源域的代表性与泛化能力。基于上述两种选择机制,所提出的SPDA方法能够有效筛选出对域适应具有实际贡献的源域与目标域数据。在多个公开数据集上的实验结果表明,该方法在部分域适应任务中具有显著的性能优势,验证了其有效性与鲁棒性。