
ドメイン一般化(domain generalization)とは、類似する未知のターゲットドメインからのデータに一般化する能力を持つ分類器を、異種の複数の訓練ソースから学習する問題であり、大規模学習やパーソナライズド推論など多岐にわたる応用を持つ。多くの実用的状況において、訓練データの各サンプルに対してドメインラベルを取得することがプライバシー上の懸念から制限されており、代わりにドメインラベルを付与せずに集約された訓練ポイントの集合しか入手できない。従来の手法では、ドメインラベルを利用してドメイン不変な特徴表現を構築するアプローチが採用されているが、このような設定ではこれらの手法は適用不可能である。したがって、ドメインラベルを一切用いずに汎化性能の高い分類器を学習するための代替的なアプローチが求められる。本論文では、この問題に対してドメイン適応型(domain-adaptive)なアプローチを提案する。本手法は以下の2段階で構成される:(a) 特に選定された特徴空間内で訓練データをクラスタリングし、仮想ドメイン(pseudo-domains)を構築する;(b) これらの仮想ドメインを用いて、入力とその所属する仮想ドメインに関する情報を両方活用して予測を行うドメイン適応型分類器を学習する。本手法は、ドメインラベルを一切使用せずに、多数のドメイン一般化ベンチマークにおいて最先端の性能を達成している。さらに、クラスタ情報を利用したドメイン一般化に関する新しい理論的保証を提供する。本手法はアンサンブルベースのアプローチとも相性が良く、大規模なベンチマークデータセット上でも顕著な性能向上をもたらす。実装コードは以下のURLから入手可能である:https://github.com/xavierohan/AdaClust_DomainBed