
摘要
在医疗保健、经济学和教育等领域,将机器学习应用于因果推断问题引起了极大的关注。特别是,个体层面的因果推断在精准医学等应用中具有重要意义。本文提出了一种新的理论分析方法和一系列算法,用于从观察数据中预测个体治疗效应(ITE),假设条件为强可忽略性(strong ignorability)。这些算法学习一种“平衡”的表示方法,使得由该表示方法诱导的治疗组和对照组分布看起来相似。我们提供了一个新颖、简单且直观的泛化误差界,表明一个表示方法的预期ITE估计误差可以被其标准泛化误差与由该表示方法诱导的治疗组和对照组分布之间的距离之和所限定。我们使用积分概率度量来测量分布之间的距离,并推导了显式的Wasserstein距离和最大均值差异(Maximum Mean Discrepancy, MMD)距离的边界。实验结果表明,新提出的算法在真实数据和模拟数据上的表现与现有最先进方法相当或更优。