HyperAI超神経

ホールドアウト

取り置き方法これは、データ セット D を 2 つの相互に排他的なセットに分割するモデル評価方法です。一方のセットをトレーニング セット S、もう一方をテスト セット T と仮定します。

D = S ∪ T 、S ∩ T = ∅

トレーニング/テスト セットの分割では、データ分布の一貫性を可能な限り保つ必要があります。結果に影響を与えるデータ分割プロセス中に導入される追加のバイアスを回避するために、通常は層別サンプリングが使用されます。

分割方法が異なればトレーニング/テストセットも異なるため、対応するモデルの評価結果も異なります。したがって、ホールドアウト方法を 1 回使用した場合の推定結果は、通常、数回のランダムな分割と繰り返しの操作が必要になります。 . テスト評価後、その平均値を評価結果とします。