剪定後
剪定後デシジョン ツリーが生成された後に実行される枝刈り操作を指します。この方法は、完全なデシジョン ツリーに基づいており、信頼性が不十分なノード ワードについては、サブツリーがリーフ ノードに置き換えられます。リーフのクラス ラベルには、ノードのサブツリー内で最も頻繁に使用されるクラスがマークされます。
プルーニング後のプロセスでは、同じ親ノードを持つノードのグループをチェックして、それらがマージされた場合のエントロピーの増加が特定のしきい値未満であるかどうかを判断します。しきい値が小さい場合、ノードのグループをマージできます。 1. 考えられるすべての結果が含まれます。
剪定後の方法
既存のツリーに基づいてテスト データを分割します。
- いずれかのサブセットがツリーである場合、枝刈りプロセスはそのサブセットに対して再帰的に行われます。
- マージせずに誤差を計算します。
- マージによってエラーが軽減される場合は、リーフ ノードをマージします。
枝刈り後のアルゴリズムのリスト
1) エラー率削減プルーニング REP (Reduced-Error Pruning)。
2) 悲観的な枝刈りコスト EBP (エラーベースの枝刈り)。
3) 複雑性プルーニング CCP (コスト-複雑性プルーニング)。
4) エラーベースのプルーニング PEP (悲観的エラー プルーニング)。
剪定前と剪定後の比較
フロントしきい値の設定は非常に敏感であり、小さな変更によってツリー全体が変化します。これに比べて、枝刈り後のスキームによって得られる結果はより優れています。
後枝刈りは、前枝刈りよりも多くの枝を保持し、アンダーフィッティングのリスクが低くなります。ただし、後枝刈りは、トレーニングされたデシジョン ツリーに基づいており、ボトムアップのレイヤーごとのスキャン決定方法を採用しています。時間とオーバーヘッドは枝刈り前よりも大きくなります。
剪定前よりも後の剪定の方が一般的ですが、これは主に、剪定前方法では木の成長を止める時期を正確に見積もることが難しいためです。