
초록
의료, 경제, 교육 등 다양한 분야에서 인과 추론 문제에 기계 학습을 적용하는 것에 대한 관심이 매우 높습니다. 특히, 개별 수준의 인과 추론은 정밀 의학과 같은 중요한 응용 분야가 있습니다. 본 연구에서는 관찰 데이터로부터 개별 치료 효과(ITE)를 예측하기 위한 새로운 이론적 분석 및 알고리즘군을 제시합니다. 여기서는 '강한 무시 가능성(strong ignorability)'이라는 가정 하에 수행되었습니다. 이 알고리즘들은 치료 집단과 대조 집단이 유사해 보이는 '균형 잡힌' 표현을 학습합니다. 우리는 새로운 일반화 오차 경계를 제시하여, 표현의 예상 ITE 추정 오차가 해당 표현의 표준 일반화 오차와 표현으로 유도된 치료 집단 및 대조 집단 간의 거리의 합으로 제한됨을 보여줍니다. 우리는 적분 확률 메트릭(Integral Probability Metrics)을 사용하여 분포 간의 거리를 측정하며, Wasserstein 거리와 최대 평균 불일치(Maximum Mean Discrepancy, MMD) 거리에 대한 명시적인 경계를 도출합니다. 실제 데이터와 시뮬레이션 데이터를 이용한 실험 결과, 새롭게 제안된 알고리즘이 기존 최신 기술(state-of-the-art)과 일치하거나 그 이상의 성능을 보임을 확인할 수 있었습니다.