COSMo: CLIP Talks on Open-Set Multi-Target Domain Adaptation COSMo: オープンセット多目標ドメイン適応に関するCLIPの議論

多目標ドメイン適応(Multi-Target Domain Adaptation: MTDA)は、単一のソースドメインからドメイン不変の情報を学習し、それを複数のラベルなしターゲットドメインに適用することを指します。しかし、既存のMTDA手法は主に視覚特徴内のドメインシフトに対処することに焦点を当てており、意味論的特徴を無視しがちで未知のクラスを扱うのが困難な場合があります。これにより、オープンセット(Open-Set: OS)MTDAと呼ばれる問題が生じます。大規模なビジョン言語基盤モデルであるCLIPなどは有望ですが、これらのモデルがMTDAに持つ可能性はまだ十分に探索されていません。本論文では、COSMoという新しい手法を提案します。COSMoは、プロンプト空間においてMTDA問題に対処するために、ソースドメインガイドによるプロンプト学習を通じてドメイン非依存のプロンプトを学習します。ドメイン固有のバイアスネットワークと既知および未知のクラスに対する別々のプロンプトを使用することで、COSMoは効果的にドメインとクラスのシフトに対応できます。当該研究者らが知る限り、COSMoはオープンセット多目標ドメイン適応(Open-Set Multi-Target Domain Adaptation: OSMTDA)に対処する最初の手法であり、現実的な状況をより正確に表現し、オープンセットと多目標DA両方の課題に対処しています。COSMoは他の関連するDA手法と比較して、Mini-DomainNet, Office-31, およびOffice-Homeという3つの難易度が高いデータセットにおいて平均5.1%の改善を示しました。コードは以下のURLで公開されています:https://github.com/munish30monga/COSMo