2 个月前
COSMo: 开集多目标领域适应的CLIP对话
Monga, Munish ; Giroh, Sachin Kumar ; Jha, Ankit ; Singha, Mainak ; Banerjee, Biplab ; Chanussot, Jocelyn

摘要
多目标域适应(Multi-Target Domain Adaptation, MTDA)涉及从单一源域学习域不变的信息,并将其应用于多个未标记的目标域。然而,现有的MTDA方法主要集中在解决视觉特征中的域偏移问题,常常忽视了语义特征,并且在处理未知类别时表现不佳,这被称为开放集(Open-Set, OS)MTDA。尽管大规模视觉-语言基础模型如CLIP显示出潜力,但其在MTDA领域的应用仍处于初步探索阶段。本文介绍了一种新颖的方法COSMo,该方法通过源域引导的提示学习来学习与域无关的提示,以解决提示空间中的MTDA问题。通过利用特定于域的偏差网络以及已知类和未知类的独立提示,COSMo有效地适应了跨域和跨类别的偏移。据我们所知,COSMo是首个解决开放集多目标域适应(Open-Set Multi-Target Domain Adaptation, OSMTDA)问题的方法,提供了更加真实的世界场景表示,并同时应对了开放集和多目标域适应的挑战。与在OSMTDA设置下调整的其他相关DA方法相比,COSMo在三个具有挑战性的数据集——Mini-DomainNet、Office-31和Office-Home上平均提升了5.1%。代码可在以下地址获取:https://github.com/munish30monga/COSMo