자기지도적 공변량 균형을 통한 엔드투엔드 환자 표현 학습을 통한 인과 치료 효과 추정
인과 효과는 두 개 이상의 대안적 행동에 따른 결과를 비교한 것으로 정의할 수 있으며, 그 중 단 하나의 행동-결과 쌍만 실제로 관측된다. 의료 분야에서 인과 효과 측정의 금융 표준은 무작위 대조 시험(Randomized Controlled Trials, RCTs)이다. RCT에서는 대상 인구를 명확히 정의하고, 각 연구 샘플을 치료군 또는 대조군에 무작위로 배정한다. 인과 관계로부터 실질적인 통찰을 도출할 수 있는 큰 잠재력은, 의료, 교육, 경제학 분야에서 관찰 데이터에 인과 효과 추정기(Causal Effect Estimators)를 적용한 머신러닝 연구의 급격한 증가를 이끌었다. 관찰 데이터를 활용한 인과 효과 연구와 RCT의 주요 차이는, 관찰 데이터의 경우 치료가 이미 이루어진 후 연구가 진행되므로 치료 배정 메커니즘을 통제할 수 없다는 점이다. 이는 대조군과 치료군 간 공변량 분포에 큰 차이를 초래할 수 있으며, 결과적으로 인과 효과 비교가 왜곡되고 신뢰할 수 없게 된다. 기존의 접근 방식은 이 문제를 부분적으로 해결하려 했으며, 먼저 치료 배정을 예측한 후, 별도로 치료 효과를 추정하는 방식을 취했다. 최근 연구는 이러한 접근의 일부를 새로운 형태의 표현 학습(Representation Learning) 알고리즘으로 확장하여, 기대 치료 효과 추정 오차의 상한이 두 가지 요인에 의해 결정됨을 보였다. 이 두 요인은 표현의 결과 일반화 오차(outcome generalization-error)와 표현에 의해 유도된 치료군과 대조군 분포 간 거리(distance)이다. 이러한 분포 간 이질성을 최소화하기 위해, 본 연구에서는 특정한 자동 균형 조절(self-supervised) 목적 함수를 제안한다. 실제 데이터 및 기준 데이터셋을 대상으로 한 실험 결과, 기존에 발표된 최첨단 방법보다 본 연구의 접근이 일관되게 더 낮은 편향을 가진 추정을 제공함을 확인했다. 오차 감소는 치료군과 대조군 분포 간 이질성을 명시적으로 줄이는 표현을 학습할 수 있는 능력에 직접 기인함을 입증하였으며, 특히 관찰 데이터에서 흔히 발생하는 긍정성 가정(Positivity Assumption) 위반 상황에서도 기존 최첨단 기법보다 본 연구의 방법이 훨씬 우수한 성능을 보임을 보였다. 따라서 치료군과 대조군의 분포를 유사하게 유도하는 표현을 학습함으로써, 오차 한계의 이질성 가설을 뒷받침하는 증거를 제시하고, 인과 효과 추정 분야의 새로운 최첨단 모델을 제안한다.