
摘要
无监督域自适应(Unsupervised Domain Adaptation, UDA)旨在将一个相关但标签完备的源域中的知识迁移到一个全新的无标签目标域中。然而,大多数现有的UDA方法需要直接访问源域数据,这在源数据涉及隐私且不可共享的情况下无法适用。本文针对一种更为现实的场景,即仅能获取在源域上训练好的分类模型,而无法访问源数据本身,提出了一种新的解决思路。为有效利用源模型进行域自适应,我们提出了一种新颖的方法——源假设迁移(Source HypOthesis Transfer, SHOT)。该方法通过将目标域数据的特征拟合至冻结的源分类模型(即代表源域分类假设的模型)来学习目标域的特征提取模块。具体而言,SHOT结合信息最大化与自监督学习策略,以确保目标域特征在隐式层面与未见源域数据的特征保持一致,从而实现跨域对齐。此外,我们进一步提出一种新的标签迁移策略:根据预测置信度将目标域数据划分为两个子集,并对低置信度样本采用半监督学习方法,以提升其预测准确性。当该标签迁移策略基于SHOT的预测结果时,我们将其称为SHOT++。在数字分类与物体识别等任务上的大量实验表明,SHOT与SHOT++在性能上均达到或超越当前最先进的方法,充分验证了所提方法在多种视觉域自适应问题中的有效性。相关代码已公开,地址为:\url{https://github.com/tim-learn/SHOT-plus}。