
摘要
领域自适应旨在缓解因领域差异(domain gap)带来的知识迁移障碍。现有的领域自适应方法通常依赖于对源域与目标域标签集之间关系的丰富先验知识,这在很大程度上限制了其在现实场景中的应用。本文提出一种通用领域自适应(Universal Domain Adaptation, UDA),该方法无需任何关于标签集的先验信息。对于给定的源域标签集与目标域标签集,二者可能包含一个共有的标签子集,同时各自拥有独立的私有标签子集,从而引入了额外的类别差异(category gap)。UDA要求模型满足以下两个条件之一:(1)若目标样本对应的标签属于共有的标签集,则必须正确分类;(2)否则,应将其标记为“未知”(unknown)。尤为重要的是,UDA模型需在共用标签比例(即共用标签集占全部标签集的比例)的广泛变化范围内保持稳定性能,以应对实际应用中目标标签集未知的复杂情况。为解决通用领域自适应问题,本文提出通用自适应网络(Universal Adaptation Network, UAN)。该模型通过量化样本级别的可迁移性,自动识别出共有的标签集以及各领域独有的私有标签集,从而在自动发现的共用标签集上促进有效迁移,并准确识别出“未知”样本。大量实验评估表明,在这一全新的UDA设定下,UAN在性能上显著优于现有的闭集、部分集和开集领域自适应方法,达到了当前最优水平。