剪定前
剪定前これは枝刈りアルゴリズムの一種で、主に決定木が生成される前に実行される枝刈り操作を指します。対応するのは、決定木が生成された後に実行される枝刈り操作です。
決定木の成長プロセス中、分岐前に各ノードに対して事前推定が行われます。ノードの分割によって決定木の汎化パフォーマンスが向上しない場合、分割は停止され、ノードは次のようにマークされます。リーフノード。
事前剪定の一般的な戦略
- 高さを定義し、デシジョン ツリーがこの高さに達すると成長を停止します。
- 決定木が特定のノードのインスタンスに到達すると、これらのインスタンスは同じクラスに属していなくても、同じ特徴ベクトルを持ちます。この方法は、データの競合に対処する場合により効果的です。 ;
- しきい値を定義します。デシジョン ツリーが特定のノードに達し、インスタンスの数がしきい値を下回ると、成長が停止することがあります。
- しきい値を定義し、システム パフォーマンスに対する各拡張のゲインを計算し、ゲイン値をしきい値と比較して、拡張を停止するかどうかを決定します。
事前剪定のメリットとデメリット
- 利点: 不必要なノードの拡張を回避し、トレーニング時間とテスト時間をある程度削減します。
- デメリット:フィッティング不足のリスクがある