VC 次元理論VC 理論
VC寸法バイナリ分類器の能力を測定するために使用されます。これは、分類器が分類できるトレーニング サンプルの最大数を表します。指標関数セットの場合、その関数によって分類できるサンプルが h 個ある場合です。関数セットの場合、関数セット内の関数はすべての可能な 2h 形式になります。展開すると、関数セットは h 個のサンプルを分割できると言われ、関数セットの VC 次元は、分割できるサンプル h の最大数です。上。
任意の数のサンプルについて、すべてを分割できる関数セットが存在する場合、関数セットの VC 次元は無限となり、有界実関数の VC 次元は特定のしきい値を介してインジケーター関数に変換できます。 。
VCディメンションの意味
VC 次元の値が大きいほど、汎化能力が低下し、信頼性リスクが大きくなります。つまり、サンプル数を増やして VC 次元を減らすと、信頼性リスクを減らすことができます。
VC は、仮説 H の強力さを反映することもできます。つまり、VC の次元が大きいほど、より多くの点を分割できるため、H はより強力になります。