
要約
教師ありドメイン適応(Unsupervised Domain Adaptation: UDA)は、ラベル付きのソースデータセットから学習した知識を、ラベルのない新たなドメインにおける類似したタスクに活用することを目的としている。従来のUDA手法は、モデルの適応学習にソースデータへのアクセスを必要としており、分散型のプライベートデータに対してはリスクが高く、効率的でないという課題があった。本研究では、ソースデータにアクセスできない状況下で、すでに訓練されたソースモデルのみが利用可能であるという現実的な設定に着目し、ソースデータを一切使用せずにそのモデルを効果的に活用する方法を検討する。そこで、シンプルでありながら汎用性の高い表現学習フレームワーク「Source HypOthesis Transfer(SHOT)」を提案する。SHOTはソースモデルの分類器モジュール(仮説)を固定し、ターゲットドメインに特化した特徴抽出モジュールを、情報量最大化と自己教師付き擬似ラベル付けを活用することで学習することで、ターゲットドメインの表現をソースモデルの仮説に間接的に一致させる。その汎用性を検証するため、閉集合型、部分集合型、開集合型のドメイン適応を含む多様な適応ケースにおいてSHOTを評価した。実験の結果、SHOTは複数のドメイン適応ベンチマークにおいて最先端の性能を達成した。