
摘要
无监督域自适应旨在解决在目标域中仅有未标注样本而源域中仅有标注样本,且两个域数据分布存在差异的情况下进行分类的问题。由于源域中训练的分类器直接应用于目标域样本时,会因分布差异导致性能显著下降。为应对这一挑战,已有多种方法被提出,旨在学习域不变特征或构建域特定的分类器。然而,无论采用何种策略,目标域缺乏标注样本始终是一个关键问题,通常通过伪标签(pseudo-labeling)技术加以缓解。然而,若伪标签生成不准确,将在学习过程中引发灾难性误差累积。本文提出一种基于结构化预测的新型选择性伪标签策略。该方法的灵感源于目标域样本在深度特征空间中具有良好的聚类特性,因此可借助无监督聚类分析实现更精确的伪标签生成。在四个公开数据集(即 Office-Caltech、Office31、ImageCLEF-DA 和 Office-Home)上的实验结果表明,所提方法在性能上优于当前主流的先进方法。