要約
臨床観察データを用いた個別化治療効果(ITE)の推定は、臨床データに必然的に交絡が存在するため、困難な課題である。既存のITE推定モデルの多くは、治療効果の不偏推定量を構築することでこの問題に対処している。しかし、有用な一方で、バランスの取れた表現を学習するという目的は、ITE推定における効果的かつ判別力のあるモデルの学習という目的と、時に相反する場合がある。本研究では、マルチタスク深層学習とK近傍法(KNN)を統合した新しいハイブリッドモデルを提案する。具体的には、本モデルはまず、電子カルテ(EHR)から結果予測と治療カテゴリ分類を同時に行うことで、結果予測に有用な潜在表現および治療特有の潜在表現をマルチタスク深層学習により抽出する。その後、学習された隠れ表現を基にKNNを用いて反事実的結果を推定する。本モデルの有効性は、広く用いられる半シミュレーションデータセット(IHDP)および736例の心不全(HF)患者から構成される実臨床データセットを用いて検証された。IHDPデータセットでは、異質的効果推定における精度(PEHE)と平均治療効果(ATE)の指標でそれぞれ1.7および0.23の良好な性能を達成し、HFデータセットでは精度とF1スコアでそれぞれ0.703および0.796の結果を得た。これらの結果は、本モデルが最先端モデルと比較しても競争力のある性能を発揮することを示している。さらに、得られた結果は既存の医学分野の知見と整合するいくつかの知見を明らかにするとともに、臨床分野におけるさらなる検証が可能な示唆的な仮説を提示している。