
要約
機械学習システムは、センサネットワークや自動運転車の認識モジュール、脳-機械インターフェースに至るまで、データ分布が時間とともに変化するさまざまな応用において、その変化に適応する必要がある。本研究では、初期にソースドメインで学習された分類器を、ターゲットドメインへ徐々に分布がシフトする未ラベルデータのみを用いて適応する「徐々なドメイン適応(gradual domain adaptation)」の問題を検討する。直接ターゲットドメインに適応する場合、誤差が無限大に発散する可能性がある設定において、自己学習(self-training)における誤差に対する初めての非自明(non-vacuous)な上界を証明した。理論的解析から得られたアルゴリズム的洞察は、無限のデータが存在する場合でも正則化とラベルの鋭利化(label sharpening)が本質的に重要であることを示唆しており、Wasserstein-∞距離が小さい分布シフトに対しては自己学習が特に有効である可能性を示している。この徐々なシフト構造を活用することで、回転MNISTデータセットおよび現実的なポートレートデータセットにおいて、より高い精度が達成された。