7 个月前

Uri Shalit; Fredrik D. Johansson; David Sontag

摘要

在医疗保健、经济学和教育等领域，将机器学习应用于因果推断问题引起了极大的关注。特别是，个体层面的因果推断在精准医学等应用中具有重要意义。本文提出了一种新的理论分析方法和一系列算法，用于从观察数据中预测个体治疗效应（ITE），假设条件为强可忽略性（strong ignorability）。这些算法学习一种“平衡”的表示方法，使得由该表示方法诱导的治疗组和对照组分布看起来相似。我们提供了一个新颖、简单且直观的泛化误差界，表明一个表示方法的预期ITE估计误差可以被其标准泛化误差与由该表示方法诱导的治疗组和对照组分布之间的距离之和所限定。我们使用积分概率度量来测量分布之间的距离，并推导了显式的Wasserstein距离和最大均值差异（Maximum Mean Discrepancy, MMD）距离的边界。实验结果表明，新提出的算法在真实数据和模拟数据上的表现与现有最先进方法相当或更优。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

Uri Shalit; Fredrik D. Johansson; David Sontag

摘要

在医疗保健、经济学和教育等领域，将机器学习应用于因果推断问题引起了极大的关注。特别是，个体层面的因果推断在精准医学等应用中具有重要意义。本文提出了一种新的理论分析方法和一系列算法，用于从观察数据中预测个体治疗效应（ITE），假设条件为强可忽略性（strong ignorability）。这些算法学习一种“平衡”的表示方法，使得由该表示方法诱导的治疗组和对照组分布看起来相似。我们提供了一个新颖、简单且直观的泛化误差界，表明一个表示方法的预期ITE估计误差可以被其标准泛化误差与由该表示方法诱导的治疗组和对照组分布之间的距离之和所限定。我们使用积分概率度量来测量分布之间的距离，并推导了显式的Wasserstein距离和最大均值差异（Maximum Mean Discrepancy, MMD）距离的边界。实验结果表明，新提出的算法在真实数据和模拟数据上的表现与现有最先进方法相当或更优。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供