HyperAI超神经

地面真实值 Ground Truth

Ground Truth 是一个相对概念,是指相对于新的测量方式得到的测量值,作为基准的,由已有的、可靠的测量方式得到的测量值。机器学习领域借用了这一概念,使用训练所得模型对样本进行推理的过程,可以当做是一种广义上的测量行为。在深度学习领域,Ground Truth (常用英文表示,中文意思是「地面真实值」或「基准真实值」,简单理解就是真实值) 是指用于训练和评估模型的准确标签或数据。 Ground Truth 用于评估 ML 模型的性能以及训练和验证模型。

例如,如果正在开发 ML 模型来对动物图像进行分类,则基本事实将是每个图像的正确标签,例如「猫」、「狗」或「鸟」。该模型将在包含图像及其相应地面真实标签的数据集上进行训练,并且将根据其预测新的、未见过的图像的正确标签的准确程度来评估其性能。

特别是对于大型数据集,获取真实标签可能是一个耗时且耗力的过程。它经常需要手动检查和注释数据集中的每个案例,这可能需要大量时间。在某些情况下,可以使用自动化方法建立真实标签,但这些程序可能不太可靠,并且需要更多的手动评估和纠正。

Ground Truth 对于机器学习的重要性

Ground Truth 是机器学习的关键要素,因为它提供了比较 ML 模型性能的标准。它也是许多机器学习任务的关键要素,例如监督学习,其中模型使用真实标签进行训练和验证。相反,在无监督学习中,模型必须学会在没有任何明确指示的情况下识别数据中的模式和相关性,因为 Ground Truth 标签可能无法访问。

参考来源

【1】https://encord.com/glossary/ground-truth-definition/

【2】https://zh.wikipedia.org/wiki/%E5%9F%BA%E6%BA%96%E7%9C%9F%E7%9B%B8