
要約
機械学習の標準的なリスク最小化枠組みは、偶然的な相関(spurious correlations)により訓練分布とテスト分布が異なる環境下で運用される場合、脆弱性を示す。複数の環境からのデータを用いて訓練し、不変な予測因子(invariant predictors)を探索することで、因果関係を持つ特徴にモデルを集中させることで、偶然的な特徴の影響を低減できる。本研究では、このような不変リスク最小化を、複数の環境間におけるアンサンブルゲームのナッシュ均衡(Nash equilibrium)を求める問題として定式化する。このアプローチにより、最適応答ダイナミクス(best response dynamics)を用いるシンプルな訓練アルゴリズムを構築した。実験結果によれば、Arjovskyら(2019)の困難な二段階最適化問題(bi-level optimization problem)と比較して、同等またはより高い経験的精度を達成しつつ、著しく低い分散を示した。本研究の主な理論的貢献の一つとして、任意の有限個の環境に対して、提案するゲームのナッシュ均衡の集合が、不変予測因子の集合と等価であることを示した。これは、非線形な分類器や変換を用いる場合でも成立する。その結果、本手法はArjovskyら(2019)が示した、広範な環境への一般化保証を維持することができる。本アルゴリズムは、生成対抗ネットワーク(GAN)など、成功を収めたゲーム理論に基づく機械学習アルゴリズムの体系に新たな一翼を加えるものである。