7 天前

我们真的需要访问源数据吗?面向无监督域自适应的源假设迁移

Jian Liang, Dapeng Hu, Jiashi Feng
我们真的需要访问源数据吗?面向无监督域自适应的源假设迁移
摘要

无监督域自适应(Unsupervised Domain Adaptation, UDA)旨在利用已标注源域数据中学习到的知识,解决新无标注目标域中的相似任务。以往的UDA方法通常在模型适配过程中需要访问源数据,这使得其在去中心化私有数据场景下存在安全风险且效率低下。本文针对一种更具实际意义的设置——仅可获取训练好的源模型而无法访问源数据——提出了一种有效利用该模型解决UDA问题的新方法。为此,我们提出了一种简单但通用的表示学习框架,命名为源假设迁移(Source HypOthesis Transfer, SHOT)。SHOT冻结源模型的分类器模块(即“假设”),并通过联合利用信息最大化与自监督伪标签机制,学习目标域特定的特征提取模块,从而隐式地将目标域的表示对齐至源模型的假设空间。为验证该方法的通用性,我们在多种域自适应场景下进行了评估,包括闭集、部分集和开集域自适应。实验结果表明,SHOT在多个域自适应基准测试中均取得了当前最优的性能表现。

我们真的需要访问源数据吗?面向无监督域自适应的源假设迁移 | 最新论文 | HyperAI超神经