
要約
人間の学習とは異なり、機械学習は訓練(ソース)データとテスト(ターゲット)データの入力分布の変化を扱うことがしばしば困難です。実際のシナリオでは一般的なこのようなドメインシフトが、従来の機械学習手法の性能を著しく損ないます。ラベル付きターゲットデータの場合には、いくつかの「驚くほど簡単」に実装できるにもかかわらず非常に高い性能を示す監督型ドメイン適応手法が提案されています。しかし、実際にはターゲットドメインがしばしばラベルなしであるため、非監督型適応が必要となります。本研究では、非監督型ドメイン適応のために単純かつ効果的で効率的な方法である相関アライメント(CORAL: CORrelation ALignment)を提案します。CORALは、ターゲットラベルを必要とせずに、ソースとターゲット分布の二次統計量をアライメントすることでドメインシフトを最小限に抑えます。この手法は極めて単純であり——4行のMatlabコードで実装可能ですが——標準的なベンチマークデータセットでの広範な評価においても非常に高い性能を示しています。