ソースデータ非存在下における仮説転移とラベル転移を用いた教師なしドメイン適応

教師なしドメイン適応(Unsupervised Domain Adaptation, UDA)は、ラベル付きの関連するが異なるソースドメインから、ラベルのないターゲットドメインへ知識を転移することを目的としている。既存の大多数のUDA手法は、ソースデータへのアクセスを前提としており、プライバシー上の懸念によりデータが機密性を有し共有不可能な状況では適用できない。本論文では、ソースデータそのものにアクセスできない代わりに、その上で訓練された分類モデルのみが利用可能であるという現実的な設定に着目する。この条件下でソースモデルを効果的に活用するため、本研究では新たなアプローチである「ソース仮説転送(Source HypOthesis Transfer, SHOT)」を提案する。SHOTは、固定されたソース分類モジュール(分類仮説を表す)にターゲットデータの特徴量を適合させることで、ターゲットドメイン向けの特徴抽出モジュールを学習する。具体的には、ターゲット特徴量が同じ仮説を通じて未観測のソースデータの特徴量と暗黙的に整合するように、情報最大化と自己教師学習の両方を活用して特徴抽出モジュールの学習を実現する。さらに、予測の信頼度に基づいてターゲットデータを二つの部分に分割し、信頼度の低い予測に対しては半教師付き学習を用いて精度を向上させる新しいラベル転送戦略を提案する。SHOTによって得られた予測を用いてラベル転送を行う場合、これをSHOT++と呼ぶ。数値認識および物体認識の両タスクにおいて実施した広範な実験結果から、SHOTおよびSHOT++が最先端手法と同等あるいはそれを上回る性能を達成することが示された。これにより、本研究のアプローチが多様な視覚ドメイン適応問題に対して有効であることが確認された。実装コードは以下のURLから入手可能である:\url{https://github.com/tim-learn/SHOT-plus}。