真相/真实 Ground-truth

机器学习领域里面,真相指监督学习中,训练集对分类结果的准确设定值,一般被用于误差估算和效果评价。

监督学习中,标注数据通常以 ( x , t ) 的形式出现,其中 x 表示输入数据,t 表示标注,正确的标注便是 Ground-Truth,错误的标记便不是(也有人将所有标注数据称为 Ground-Truth)。

换句话说,Ground-truth 就是参考标准,其一般被用于错误率检测 Error Quantification,例如要根据历史数据预测某时间段的温度,那么 Ground-truth 便是对应时间段的真实温度,预测温度便是 Error。

Ground-truth 还被用于奖惩学习机制 Reinforcement Learning,即在学习中加入奖惩机制,例如程序的输出越接近 Ground-truth,产生这个结果的数据权重就越大。

参考来源

【1】知乎问答:关于 Ground-Truth