HyperAI

Vérité Fondamentale

La vérité fondamentale est un concept relatif. Il s'agit de la valeur de mesure obtenue par une méthode de mesure existante et fiable comme référence par rapport à la valeur de mesure obtenue par une nouvelle méthode de mesure. Le domaine de l’apprentissage automatique emprunte ce concept, et le processus d’utilisation du modèle formé pour déduire des échantillons peut être considéré comme un comportement de mesure large.Dans le domaine de l'apprentissage profond, Ground Truth (couramment utilisé en anglais, signifiant « vérité terrain » ou « vérité de référence » en chinois, simplement compris comme la vraie valeur) fait référence aux étiquettes ou données précises utilisées pour former et évaluer les modèles. Ground Truth est utilisé pour évaluer les performances des modèles ML ainsi que pour former et valider les modèles.

Par exemple, si vous développez un modèle ML pour classer des images d'animaux, la vérité fondamentale serait l'étiquette correcte pour chaque image, comme « chat », « chien » ou « oiseau ». Le modèle sera formé sur un ensemble de données contenant des images et leurs étiquettes de vérité terrain correspondantes, et ses performances seront évaluées en fonction de la précision avec laquelle il prédit les étiquettes correctes pour les images nouvelles et invisibles.

En particulier pour les grands ensembles de données, l’obtention de véritables étiquettes peut être un processus long et exigeant en main-d’œuvre. Cela nécessite souvent une inspection manuelle et une annotation de chaque cas dans l’ensemble de données, ce qui peut prendre beaucoup de temps. Dans certains cas, des étiquettes de vérité fondamentale peuvent être établies à l’aide de méthodes automatisées, mais ces procédures peuvent être moins fiables et nécessiter davantage d’évaluation et de correction manuelles.

Importance de la vérité terrain pour l'apprentissage automatique

Ground Truth est un élément essentiel de l’apprentissage automatique car il fournit une norme pour comparer les performances des modèles ML. Il s’agit également d’un élément clé de nombreuses tâches d’apprentissage automatique, telles que l’apprentissage supervisé, où les modèles sont formés et validés à l’aide de véritables étiquettes. En revanche, dans l’apprentissage non supervisé, le modèle doit apprendre à reconnaître les modèles et les corrélations dans les données sans aucune instruction explicite, car les étiquettes de vérité fondamentale peuvent ne pas être accessibles.

Références

【1】https://encord.com/glossary/ground-truth-definition/

【2】https://zh.wikipedia.org/wiki/