
要約
機械学習を医療、経済、教育などの分野における因果推論の問題に適用することへの関心が高まっています。特に、個体レベルの因果推論は精密医療など重要な応用を持っています。本研究では、観察データから個体治療効果(ITE)を予測するための新しい理論解析とアルゴリズム群を提案します。強無視可能性(strong ignorability)という仮定のもとで、これらのアルゴリズムは「バランスの取れた」表現を学習し、介入群と対照群の分布が類似するようにします。私たちは新たな一般化誤差境界を示し、その表現によるITE推定誤差の期待値は、その表現の標準的な一般化誤差と、表現によって誘導される介入群と対照群の分布間距離の和で制限されることを直感的に説明しています。分布間距離は積分確率計量を使用して測定され、ワッサーシタイン距離と最大平均相違(Maximum Mean Discrepancy, MMD)距離について具体的な境界値を導出しています。実際のデータとシミュレーションデータを用いた実験結果は、新規アルゴリズムが現行最先端技術に匹敵または優劣していることを示しています。