Search for a command to run...
日付
剪定決定木の分岐を止める方法で、主に決定木を単純化するために、決定木の過学習の問題を解決するために使用されます。
枝刈りの理由は、決定木の学習プロセスでは、トレーニング サンプルをできるだけ正確に分類するためにノードが継続的に生成されるため、決定木の分岐が多すぎて効率が低下するためです。 、デシジョン ツリーを簡素化するには枝刈り操作が必要です。
デシジョン ツリー アルゴリズムは、ツリーの最適なサイズを決定する必要があります。大きすぎるツリーは過剰適合し、新しいサンプルに一般化することが困難になります。同時に、小さなツリーはサンプルに関する構造情報を取得できない可能性があります。空間。
単一のノードでエラー率が減少するかどうかを判断することは不可能であるため、ツリー アルゴリズムの停止時間も判断が困難です。最も一般的な戦略は、各ノードに含まれるインスタンスの数が少なくなるまでツリーを成長させ、その後枝刈りを使用することです。不要なノードを削除します。
枝刈りの原則は、決定木のサイズを決定する方法にあります。
枝刈りの具体的な操作は、決定木からいくつかのサブツリーまたはリーフ ノードを減算し、ルート ノードまたは親ノードをリーフ ノードとして使用することです。
剪定は通常、剪定前と剪定後の 2 つのカテゴリに分類されます。
アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。