HyperAI超神経

グラウンドトゥルース

Ground Truth は、新しい測定方法で得られた測定値に対するベンチマークとして、既存の信頼できる測定方法で得られた測定値を指す相対的な概念です。機械学習の分野では、この概念を借用しており、トレーニングされたモデルを使用してサンプルについて推論するプロセスは、広い意味での測定動作とみなすことができます。深層学習の分野では、グラウンド トゥルース (英語で一般的に表現され、中国語では「グラウンド トゥルース」または「ベース トゥルース」を意味し、単に真の値として理解されます) は、モデルのトレーニングと評価に使用される正確なラベルまたはデータを指します。 Ground Truth は、ML モデルのパフォーマンスを評価し、モデルをトレーニングおよび検証するために使用されます。

たとえば、動物の画像を分類するための ML モデルを開発している場合、グラウンド トゥルースは、「猫」、「犬」、「鳥」などの各画像の正しいラベルになります。モデルは、画像とそれに対応するグラウンド トゥルース ラベルを含むデータセットでトレーニングされ、そのパフォーマンスは、新しい未見の画像の正しいラベルをどれだけ正確に予測するかに基づいて評価されます。

特に大規模なデータセットの場合、真のラベルを取得するのは時間と労力がかかるプロセスになる可能性があります。多くの場合、データセット内の各ケースを手動で検査してアノテーションを付ける必要があり、これには多大な時間がかかる場合があります。場合によっては、自動化された方法を使用して真のラベルを確立することが可能ですが、これらの手順の信頼性が低く、手動による評価と修正がさらに必要になる場合があります。

機械学習におけるグラウンドトゥルースの重要性

Ground Truth は、ML モデルのパフォーマンスを比較するための標準を提供するため、機械学習の重要な要素です。これは、実際のラベルを使用してモデルがトレーニングおよび検証される教師あり学習など、多くの機械学習タスクの重要な要素でもあります。対照的に、教師なし学習では、Ground Truth ラベルにアクセスできない可能性があるため、モデルは明示的な指示なしでデータ内のパターンと相関関係を認識することを学習する必要があります。

参考文献

【1】https://encord.com/glossary/ground-truth-definition/

【2】https://zh.wikipedia.org/wiki/