HyperAI

Post-taille

Post-tailleFait référence à l'opération d'élagage effectuée après la génération de l'arbre de décision. Cette méthode est basée sur l’arbre de décision complet et permet à l’arbre de sur-adapter les données d’entraînement. Pour les mots de nœud avec une confiance insuffisante, le sous-arbre sera remplacé par un nœud feuille, et l'étiquette de classe de la feuille est marquée avec la classe la plus fréquente dans le sous-arbre de nœud.

Le processus de post-élagage consiste à vérifier un groupe de nœuds avec le même nœud parent pour déterminer si l'augmentation de l'entropie est inférieure à un certain seuil s'ils sont fusionnés. Lorsque le seuil est petit, un groupe de nœuds peut être fusionné en un seul, qui contient tous les résultats possibles.

Méthode post-taille

Divisez les données de test en fonction de l’arborescence existante :

  • Si un sous-ensemble est un arbre, effectuez de manière récursive le processus d'élagage sur ce sous-ensemble ;
  • Calculer les erreurs non combinées ;
  • Si la fusion réduit l’erreur, fusionnez les nœuds feuilles.

Liste des algorithmes post-élagage

1) Élagage à erreur réduite (REP) ;

2) Coût d'élagage pessimiste EBP (Error-Based Pruning) ;

3) Élagage en fonction des coûts et de la complexité (CCP) ;

4) Élagage basé sur les erreurs PEP (Élagage pesimiste des erreurs).

Comparaison entre la pré-taille et la post-taille

Le réglage du seuil avant est très sensible et un petit changement entraînera des changements dans l'ensemble de l'arbre. En comparaison, le schéma post-taille produira de meilleurs résultats.

La post-taille conserve plus de branches et présente un risque de sous-ajustement plus faible que la pré-taille. Cependant, la post-élagage est basée sur l'arbre de décision formé et utilise une méthode d'analyse couche par couche de bas en haut. Par conséquent, le temps et le coût de la formation sont plus élevés que ceux de la pré-taille.

Par rapport à la taille frontale, les schémas de post-taille sont plus courants, principalement parce qu'il est plus difficile d'estimer avec précision quand arrêter la croissance de l'arbre dans les méthodes de taille frontale.

Mot parent : élagage
Mot apparenté : pré-taille