分类与回归树 CART Decision Tree

CART Decision Tree 是一种决策树算法,能够用于分类和回归任务。由伯克利大学统计学教授 Leo Breiman 和 Charles Joel Stone 以及斯坦福大学的 Jerome H. Friedman 和 Richard Olshen 于 1977 年开发。该算法广泛应用于数据挖掘和机器学习领域,它的核心在于递归地将数据集分割成越来越小的子集,并在这个过程中构建决策树。

CART 生成的是二叉树,每个内部节点都有一个决策规则,每个叶节点给出一个预测结果。每次分割都是基于单个变量的阈值进行。 CART 使用剪枝策略来避免过拟合,提高模型的泛化能力。 CART 还可以构建分类树和回归树,适用于不同类型的预测任务。

参考来源

【1】The Complete Guide to Decision Tree Analysis

【2】History of CART

【3】Classification and Regression Trees