
摘要
我们开发了一种贝叶斯“树之和”模型,其中每棵树都受到正则化先验的约束,使其成为一个弱学习器,拟合和推断通过迭代贝叶斯后向拟合马尔可夫链蒙特卡洛(MCMC)算法实现,该算法从后验分布中生成样本。实际上,BART是一种非参数贝叶斯回归方法,它使用维度自适应的随机基元素。受集成方法的启发,特别是提升算法的影响,BART由一个统计模型定义:先验和似然函数。这种方法使得可以进行完整的后验推断,包括对未知回归函数的点估计和区间估计以及潜在预测变量的边际效应。通过记录预测变量的包含频率,BART还可以用于无模型变量选择。BART的众多特性在42个不同数据集上与竞争方法进行了对比测试,并通过一个模拟实验和一个药物发现分类问题得到了进一步说明。