HyperAI

Algorithme De Forêt Aléatoire

Forêt aléatoireIl s’agit d’un algorithme multifonctionnel qui comprend plusieurs arbres de décision. Il utilise un ensemble d’échantillons constitué d’un échantillonnage de remplacement pour former l’arbre de décision. Chaque nœud de l’arbre de décision utilise uniquement certaines fonctionnalités de l’échantillonnage aléatoire pendant la formation.

Lors de la classification d'un nouvel objet en fonction d'un attribut, chaque arbre de la forêt aléatoire donnera d'abord son propre choix de classification et « votera » pour celui-ci. Pour les problèmes de classification, la sortie de la forêt sera celle qui aura le plus de votes ; pour les problèmes de régression, la sortie de la forêt sera la moyenne des sorties des arbres de décision.

Dans l'algorithme de forêt aléatoire, « aléatoire » est le cœur et « forêt » n'est qu'une méthode de combinaison. Lors de la construction de chaque arbre, la forêt adopte généralement deux à trois couches d’aléatoire pour assurer l’indépendance de chaque arbre.

Fonctionnalités de la forêt aléatoire

  • Avantages : précision extrêmement élevée, pas facile à surajuster, bonne résistance au bruit, peut gérer des données de grande dimension sans sélection de fonctionnalités, peut gérer des données discrètes et des données continues, les ensembles de données n'ont pas besoin d'être normalisés, vitesse d'entraînement rapide, peut obtenir un classement d'importance variable et facile à paralléliser.
  • Inconvénients : paramètres complexes, espace et temps importants requis pour la formation et certaines zones du modèle ne peuvent pas être expliquées.

Application de forêt aléatoire

  • Effectuer des tâches de régression et de classification ;
  • Utilisé pour gérer les valeurs manquantes, les valeurs aberrantes et d’autres étapes importantes dans l’exploration des données ;
  • Utilisé pour combiner plusieurs modèles inefficaces en un seul modèle efficace.
Mot parent : algorithme de bagging
Sous-mots : Arbre de décision

Références

【1】https://blog.csdn.net/qq547276542/article/details/78304454

【2】https://blog.csdn.net/lishuandao/article/details/52555103

【3】https://en.wikipedia.org/wiki/Random_forest

【4】http://dataunion.org/23602.html