
教師なしドメイン適応(Unsupervised Domain Adaptation, UDA)は、共通のラベル空間を持つが分布が異なるラベル付きソースドメインデータを前提として、ラベルなしのターゲットドメインデータの分類問題に取り組む。近年の多くの手法は、二つのドメイン間の特徴分布を明示的に一致させるアプローチを採用している。一方、ドメイン適応の根本的な仮定に着目し、本研究では、密接に関連するラベル付きソースデータから得られる強力なプライベート情報(privileged information)を活用して、ターゲットデータの判別的クラスタリング(discriminative clustering)としてドメイン適応問題を再定式化する。技術的に、ターゲットデータを適応的にフィルタリングするロバストなエントロピー最小化の変種に基づくクラスタリング目的関数、ソフトFisher型基準、および重心分類によるクラスタ順序付けを用いる。判別的ソース情報のターゲットクラスタリングへの抽出を実現するため、ラベル付きソースデータ上で並列的に定義された教師あり学習目的関数を統合的に最適化するネットワーク学習戦略を提案する。本手法を「DisClusterDA(Discriminative Clustering for Domain Adaptation)」と命名する。さらに、DisClusterDAの構成要素となる目的関数がクラスごとに純粋でコンパクトな特徴分布を学習する仕組みについて、幾何学的な直感を提示する。5つの代表的なベンチマークデータセット(多ソースドメイン適応を含む)において、慎重なアブレーションスタディおよび広範な実験を実施した結果、一般的に用いられるバックボーンネットワークを用いても、既存手法を上回る性能を達成した。また、本DisClusterDAフレームワークにおいて、ドメイン間のクラスレベル特徴分布を明示的に一致させる追加の損失項を導入すると、逆に適応性能が低下することが観察された。ただし、異なるアルゴリズムフレームワークにおけるより詳細な検討が今後必要である。