Margin-Theorie
IntervalltheorieEs handelt sich um ein Konzept in Support Vector Machines, bei dem sich das Intervall auf den Mindestabstand zwischen zwei Arten von Stichproben bezieht, die durch eine Hyperebene geteilt werden. Mithilfe der Intervalltheorie lässt sich erklären, dass, wenn der Trainingsfehler des AdaBoost-Algorithmus 0 ist, kontinuierliches Training die Generalisierungsleistung des Modells weiter verbessern kann.
Seien x und y die Eingangs- und Ausgangsräume der Stichproben, D die wahre Verteilung der Stichproben auf x · y und S= ist eine Stichprobe auf der Stichprobe D. Im Hypothesenraum H werden die Basisklassifikatoren h : x → y gewichtet zu einem Ensemble-Klassifikator kombiniert. F ∈ C(H), die konvexe Hülle von H.
Im AdaBoost-Algorithmus wird der Ensemble-Klassifikator f(x) durch gewichtete Abstimmung einer Reihe von Basisklassifikatoren erstellt, d. h. . Wobei
ist. Basierend auf der Definition des starken Klassifikators kann das folgende Intervall definiert werden:
Das heißt, die gewichtete Differenz zwischen richtigen und falschen Stimmen.