HyperAI

Apprenant Individuel

Apprenant individuelIl s’agit d’un concept relatif, qui est l’apprenant avant l’intégration dans l’apprentissage d’ensemble.

Selon la manière dont les apprenants individuels sont générés, les méthodes d’apprentissage d’ensemble peuvent être divisées en deux catégories suivantes :

  • Il existe de fortes dépendances et les méthodes de sérialisation doivent être générées en série, comme Boosting.
  • Il n'y a pas de forte dépendance entre les méthodes parallèles qui peuvent être générées simultanément, représentées par Bagging et Random Forest.

Le boosting est un algorithme qui peut promouvoir les apprenants faibles en apprenants forts. Il forme d'abord un apprenant de base à partir de l'ensemble de formation initial, puis ajuste la distribution des échantillons de formation en fonction de l'apprenant de base afin que les échantillons de formation que l'apprenant de base a mal reçus reçoivent plus d'attention à l'avenir, puis forme l'apprenant de base suivant en fonction de la distribution d'échantillons ajustée ; ce processus est répété jusqu'à ce que le nombre d'apprenants de base atteigne une valeur prédéterminée T, et finalement ces T apprenants sont combinés de manière pondérée.

L'ensachage est un représentant des méthodes d'apprentissage d'ensemble parallèle, qui repose sur l'échantillonnage bootstrap et se concentre sur la réduction de la variance. L'algorithme de forêt aléatoire est une variante étendue de l'ensachage, qui construit un ensemble d'ensachage basé sur des arbres de décision et introduit en outre la sélection aléatoire d'attributs dans le processus de formation des arbres de décision.

Références

【1】Notes sur l'apprentissage automatique - Apprentissage d'ensemble (article Zhihu)