HyperAI

Pré-ponçage

Pré-tailleIl s'agit d'un type d'algorithme d'élagage, qui fait principalement référence à l'opération d'élagage effectuée avant la génération de l'arbre de décision. Le correspondant est le post-élagage, qui vise à effectuer des opérations d'élagage après la génération de l'arbre de décision.

Lors de la croissance de l'arbre de décision, une estimation préliminaire est effectuée avant chaque branche de nœud. Si la division du nœud ne peut pas améliorer les performances de généralisation de l’arbre de décision, alors la division est arrêtée et le nœud est marqué comme nœud feuille.

Stratégies courantes pour la pré-taille

  • Définissez une hauteur, et lorsque l’arbre de décision atteint cette hauteur, il cesse de croître ;
  • Lorsque l'arbre de décision atteint un nœud, ces instances ont le même vecteur de caractéristiques, même si elles n'appartiennent pas à la même classe, la croissance de l'arbre de décision peut être arrêtée. Cette méthode est plus efficace pour gérer les conflits de données.
  • Définir un seuil. Lorsque l'arbre de décision atteint un certain nœud et que le nombre d'instances est inférieur au seuil, il peut cesser de croître.
  • Définissez un seuil, calculez le gain de chaque extension sur les performances du système et comparez la valeur du gain avec le seuil pour décider s'il faut arrêter la croissance.

Avantages et inconvénients de la pré-taille

  • Avantages : éviter l'extension inutile des nœuds et réduire dans une certaine mesure le temps de formation et le temps de test
  • Inconvénients : Il existe un risque de sous-ajustement
Mot parent : élagage
Synonyme : post-taille