因果効果とは、二つ以上の代替行動に起因する結果を比較することによって定義される。その中で実際に観測されるのは、行動と結果のペアのうち一つのみである。医療分野において、因果効果の測定のゴールドスタンダードは、対象集団を明確に定義し、各サンプルを治療群または対照群に無作為に割り当てるランダム化比較試験(RCT)である。因果関係から実行可能な知見を導出する潜在的価値の高さから、機械学習分野では、医療、教育、経済学などにおける観察データに因果効果推定器を適用する研究が急速に増加している。観察データを用いた因果効果研究とRCTとの主な違いは、観察データでは処置がすでに実施された後に研究が行われるため、処置割り当てのメカニズムを制御できない点にある。これにより、対照群と治療群の共変量分布間に大きな差異が生じ、因果効果の比較が混同され、信頼性を欠くこととなる。従来のアプローチは、この問題を段階的に解決しようとしてきた。まず処置割り当てを予測し、その後に処置効果を別々に推定するという手法であった。近年の研究では、これらのアプローチの一部が、新たな表現学習アルゴリズムの一族に拡張され、期待処置効果推定誤差の上限が、二つの要因によって決定されることを示した。すなわち、表現のアウトカム一般化誤差(outcome generalization-error)と、表現によって誘導される治療群と対照群の分布間の距離である。このような分布の類似性を最小限に抑えるために、本研究では、特定の自己教師付き自動バランス化目的関数を提案する。実データおよびベンチマークデータセットを用いた実験の結果、本手法は、これまでに発表された最先端手法よりも一貫してバイアスの少ない推定値を生成することが明らかになった。さらに、推定誤差の低減が、治療群と対照群の分布間の類似性を明示的に低減する表現を学習できる能力に起因することを示した。また、観察データにおいて頻出するポジティビティ仮定(positivity assumption)の違反状況においても、本手法は従来の最先端手法よりも顕著に優れた性能を発揮することを示した。したがって、治療群と対照群の分布を類似させる表現を学習することで、誤差バウンドの類似性仮説(error bound dissimilarity hypothesis)を裏付ける証拠を提供するとともに、因果効果推定の新たな最先端モデルを提示するものである。