特征选择 Feature selection

特征选择是选择特征子集的过程,通常被用于共建模型,其优点主要有以下几点:

  • 简化模型;
  • 缩短训练时间;
  • 改善通用性、降低过拟合

特征选择算法可被看作搜索技术、评价指标的结合,前者提供候选的新特征子集,后者为不同的特征子集打分。最简单的算是测试每个子集,并找到错误率最低的子集。这种算法需要穷举搜索空间,由于难以完成所有特征集计算,因此只能涵盖较少部分特征子集,且对算法的影响较大。

通过不同的评价指标,可将特征选择算法分为三类:包装类、过滤类和嵌入类

参考来源

【1】特征选择(维基百科)