
초록
기계 학습의 전통적인 위험 최소화 패러다임은 훈련 분포와 다른 테스트 분포를 가진 환경에서 작동할 경우, 부정확한 상관관계(스푸리어 코릴레이션)로 인해 취약해진다. 여러 환경에서의 데이터를 사용하여 훈련하고, 결과와 인과적 관계가 있는 예측 변수(invariant predictors)를 찾는 방식은 부정확한 특징의 영향을 줄이는 데 효과적이다. 본 연구에서는 이러한 인과적 예측을 위한 위험 최소화를, 여러 환경 간의 앙상블 게임(ensemble game)의 나시 균형(Nash equilibrium)을 찾는 문제로 재정의한다. 이를 통해 최적 반응 동역학(best response dynamics)을 활용하는 간단한 훈련 알고리즘을 개발하였으며, 실험 결과, Arjovsky 등(2019)의 복잡한 이중 수준 최적화 문제(dual-level optimization problem)보다 훨씬 낮은 분산을 가지면서도 유사하거나 더 높은 경험적 정확도를 달성하였다. 본 연구의 주요 이론적 기여 중 하나는, 유한 개의 환경에 대해 제안된 게임의 나시 균형 집합이 비선형 분류기와 변환을 포함하더라도, 항상 인과적 예측 변수의 집합과 동치임을 보이는 것이다. 그 결과, 본 방법은 Arjovsky 등(2019)이 제시한 넓은 범위의 환경에 대한 일반화 보장도 유지한다. 제안된 알고리즘은 생성적 적대 신경망(GAN)과 같은 성공적인 게임 이론 기반 기계 학습 알고리즘의 컬렉션에 기여한다.