プロトタイプベースのクロスドメイン自己教師付き学習による少サンプル非教師付きドメイン適応

教師なしドメイン適応(Unsupervised Domain Adaptation, UDA)は、ラベル付きのソースドメインからラベルなしのターゲットドメインへ予測モデルを転送する手法である。しかし、一部の応用においては、ソースドメインでのラベル収集さえも高コストであるため、従来の多くは実用性に欠ける。この問題に対処するために、最近の研究ではインスタンス単位のクロスドメイン自己教師学習を実施し、その後に追加のファインチューニングステージを設けている。しかし、インスタンス単位の自己教師学習は低レベルの判別性特徴のみを学習・整列するにとどまる。本論文では、少量ラベル学習における教師なしドメイン適応(Few-shot Unsupervised Domain Adaptation, FUDA)を対象として、エンド・ツー・エンド型のプロトタイプクロスドメイン自己教師学習(Prototypical Cross-domain Self-Supervised Learning, PCS)フレームワークを提案する。PCSは、ドメイン間の低レベル特徴の整列を実施するだけでなく、共有埋め込み空間においてドメイン間でカテゴリごとの意味構造を符号化・整列する。本フレームワークは、ドメイン内におけるプロトタイプ対比学習によりデータのカテゴリごとの意味構造を捉え、ドメイン間のプロトタイプ自己教師学習を通じて特徴の整列を実現する。最先端手法と比較して、PCSはOffice、Office-Home、VisDA-2017、DomainNetの各ドメインペアにおいて、FUDAタスクにおける平均分類精度をそれぞれ10.5%、3.5%、9.0%、13.2%向上させた。本研究のプロジェクトページは、http://xyue.io/pcs-fuda/index.html にて公開されている。