
要約
我々は、複数のソースドメインからなるデータセットから、未観測のターゲットドメインに対しても良好に一般化するモデルを学習することを目指す。このようなドメイン一般化(domain generalization)の状況における主な課題は、学習段階でターゲットドメインのデータが一切利用できないことにより、学習されたモデルが未観測のターゲットドメインに明示的に適応されていない点にある。本研究では、単一のテストサンプルに対して一般化する能力を学習するアプローチを提案する。我々はメタ学習(meta-learning)の枠組みを活用し、訓練時に単一サンプルでの適応能力をモデルに学習させ、テスト時に各単一テストサンプルに対して自身を再適応できるようにする。具体的には、テストサンプルを条件としてモデルパラメータの生成に組み込むことで、単一テストサンプルへの適応を変分ベイズ推論(variational Bayesian inference)の問題として定式化する。このアプローチにより、テスト時に追加のファインチューニングや未観測ドメインからの追加データを用いた自己教師学習を一切行わずに、各テストサンプルに対して1回の順伝播(feed-forward)計算で適応が可能となる。広範なアブレーション研究により、本モデルが訓練時にドメインシフトを模倣することで、各単一サンプルに対するモデル適応能力を学習していることが示された。さらに、複数のドメイン一般化ベンチマークにおいて、本モデルは最先端手法と同等以上、あるいはより優れた性能を達成している。