
要約
従来の教師なしドメイン適応(UDA)手法は、ドメイン不変な特徴抽出器の学習を目的としていることが多く、モデルが十分に判別力のある特徴を学習するのを妨げる可能性がある。これを解決するために、プロンプト学習に基づく一連の研究では、大規模な事前学習済み視覚言語モデルの力を活用し、ドメインに依存しないとドメイン特有の学習可能なプロンプトのセットを通じて、両方の特徴を同時に学習するアプローチが提案されている。これらの研究では、通常、表現空間、出力空間、またはプロンプト空間に不変性制約を課して、このようなプロンプトを学習している。一方、本研究では、UDAを各目的がドメイン損失によって表現される多目的最適化問題として定式化する。この新しい枠組みの下で、各目的間の勾配を一致させることで、それらの合意を促進する手法を提案する。さらに、この深層学習アーキテクチャの微調整時に過学習が生じる可能性を防ぐため、これらの勾配のノルムをペナルティとして課す。これらの目標を達成するために、単一ソースおよびマルチソースのUDAの両方で適用可能な実用的な勾配更新手順を設計した。実証的な評価において、本手法は他の視覚言語モデル適応手法を一貫して上回る性能を示した。実装コードは以下のURLで公開されている:https://github.com/VietHoang1512/PGA。