Théorie Des Marges
Théorie des intervallesIl s'agit d'un concept dans les machines à vecteurs de support, où l'intervalle fait référence à la distance minimale entre deux types d'échantillons divisée par un hyperplan, et la théorie des intervalles peut être utilisée pour expliquer que lorsque l'erreur d'apprentissage de l'algorithme AdaBoost est de 0, la poursuite de l'apprentissage peut encore améliorer les performances de généralisation du modèle.
Soit x et y représentent les espaces d'entrée et de sortie des échantillons, D est la vraie distribution des échantillons sur x · y, et S= est un échantillonnage sur l'échantillon D. Dans l'espace d'hypothèses H, les classificateurs de base h : x → y sont pondérés et combinés pour former un classificateur d'ensemble. f ∈ C(H), qui est l'enveloppe convexe de H.
Dans l'algorithme AdaBoost, le classificateur d'ensemble f(x) est produit par vote pondéré d'une série de classificateurs de base, c'est-à-dire . Où
, en se basant sur la définition du classificateur fort, l'intervalle suivant peut être défini :
C'est-à-dire la différence pondérée entre les votes corrects et les votes incorrects.