
摘要
本文研究了通用域适应(Universal Domain Adaptation, UniDA)问题,其目标是在标签空间未对齐的情况下,实现从源域到目标域的知识迁移。UniDA 的主要挑战在于如何有效区分共现类别(即在不同域中均存在的类别)与私有类别(即仅存在于某一域中的类别)。以往方法通常将目标域中的私有样本视为单一通用类别,忽视了其内在结构。这一处理方式导致潜在空间中的表示不够紧凑,容易与共现样本混淆。为更充分地挖掘目标域的内在结构,本文提出了一种新的方法——域一致性聚类(Domain Consensus Clustering, DCC),该方法利用域间一致性知识,对共现样本与私有样本均进行判别性聚类。具体而言,DCC 从两个层面提取域一致性知识以支持聚类与私有类别发现:一是语义层面的一致性,通过识别循环一致的聚类来确定共现类别;二是样本层面的一致性,利用跨域分类结果的一致性来确定聚类数量,并识别私有类别。基于 DCC,我们能够有效分离私有类别与共现类别,并进一步区分不同私有类别之间的差异。在此基础上,我们对识别出的共现样本采用类别感知对齐(class-aware alignment)技术,以最小化域间分布偏移;同时引入原型正则化(prototypical regularizer),以增强目标域聚类的判别能力。在四个基准数据集上的实验结果表明,所提出的 DCC 方法显著优于现有的最先进方法。