
摘要
在传统的无监督域自适应问题中,通常假设源域与目标域共享相同的类别集合。然而在实际应用中,目标域数据往往仅来源于源域类别的一个子集,且由于目标域数据为无标签,其具体所属类别事先未知。这一问题在文献中被定义为部分域自适应(Partial Domain Adaptation, PDA),其挑战性主要源于负迁移问题——即源域中与目标域无关的类别数据会干扰域自适应过程,导致性能下降。本文提出一种基于逐步检测源域异常类别的方法来解决PDA问题。通过逐步识别并剔除源域中与目标域无关的异常类别,PDA问题被转化为一个更易处理的无监督域自适应问题,从而有效避免负迁移的影响。具体而言,我们采用保持局部结构的投影(Locality Preserving Projection, LPP)学习一个共享的低维隐空间,并在该空间中引入标签传播算法对目标域数据进行伪标签预测。若某一源域类别在目标域中未被任何样本分配标签,则判定其为异常类别,并从源域中移除。该过程迭代进行,直至类别集合收敛。在常用数据集Office31和Office-Home上的实验结果表明,所提方法取得了当前最优的性能,平均准确率分别达到98.1%和75.4%,显著优于现有方法。