
摘要
无监督域适应旨在解决在目标域数据无标签的情况下进行分类的问题,其中源域数据虽与目标域共享相同的标签空间,但其数据分布不同。目前大多数方法采用显式对齐两个域之间特征分布的策略。与此不同,我们基于域适应的基本假设,将域适应问题重新建模为一种判别性聚类任务:利用与目标域密切相关的、带有标签的源域数据所提供的强特权信息,对目标域数据进行聚类。在技术实现上,我们采用基于鲁棒熵最小化变体的聚类目标,该方法可自适应地过滤目标域数据;引入类似Fisher判别准则的软约束;并进一步通过中心点分类实现聚类顺序的优化。为从源域中提炼出具有判别性的信息以指导目标域聚类,我们提出一种联合训练策略,即在带标签的源域数据上并行地施加监督学习目标。我们将这一基于知识蒸馏的判别性聚类方法称为DisClusterDA。此外,我们提供了几何直观解释,说明DisClusterDA中各组成部分如何协同作用,以学习到类别层面纯净且紧凑的特征分布。我们在五个主流基准数据集上开展了细致的消融实验和广泛的对比实验,其中包括一个多元源域适应场景。基于常用的骨干网络结构,DisClusterDA在这些基准上均优于现有方法。值得注意的是,在我们的DisClusterDA框架中,添加一个显式学习跨域类别级特征分布对齐的额外损失项反而会损害域适应性能,尽管未来还需在不同算法框架下进行更深入的探究。