性能度量 Performance Measure

性能度量是用于衡量模型泛化能力的评价标准,其被用于判定机器学习结果的好坏程度。

在比对不同模型能力时,使用不同的性能度量会导致不同的评判结果,判断模型的好坏是相对的,其取决于采用什么性能度量,而性能度量类型则取决于实际的任务需求。

常用性能度量

  • 回归任务中的性能度量:均方差
  • 分类任务中的性能度量:错误率和精度;查准率、查全率和 F1 度量;受试者工作特征曲线 ROC 和 AUC (Area under ROC Curve);代价敏感错误率和代价曲线。