HyperAI

Verstärkungsverhältnis

GewinnrateBezieht sich normalerweise auf die Informationsgewinnrate, die das Verhältnis der Knoteninformationen zum Knotenaufteilungsinformationsmaß darstellt. Die Gewinnrate wird normalerweise als eine der Methoden zur Attributauswahl verwendet. Die anderen beiden gängigen Methoden sind Informationsgewinn und Gini-Index.

Die Formel für die Gewinnrate lautet wie folgt:

Normalerweise wird das Attribut mit der größten Gewinnrate als das beste Aufteilungsattribut verwendet. Wenn zu viele Werte eines einzelnen Attributs vorhanden sind, wird SplitInfoR(D) größer, was zu einem kleineren GainRatio(R) führt. Allerdings bringt die Gewinnrate auch Nachteile mit sich. Wenn SplitInfo(D) 0 ist, hat die Berechnung keine Bedeutung; und wenn SplitInfo(D) gegen 0 tendiert, wird der GainRatio(R)-Wert unzuverlässig. Die Verbesserungsmaßnahme besteht darin, dem Nenner eine Glättung hinzuzufügen. Hier wird ein Durchschnittswert aller aufgeteilten Informationen addiert:

Verweise

【1】Detaillierte Erklärung des Informationsgewinns und der Informationsgewinnrate

【2】Data-Mining-Reihe – Entscheidungsbaum-Klassifizierungsalgorithmus