HyperAI

Random Forest Algorithmus

Zufälliger WaldEs handelt sich um einen multifunktionalen Algorithmus, der mehrere Entscheidungsbäume umfasst. Zum Trainieren des Entscheidungsbaums wird ein aus Ersatzstichproben bestehender Stichprobensatz verwendet. Jeder Knoten des Entscheidungsbaums verwendet während des Trainings nur einige Merkmale der Zufallsstichprobenziehung.

Bei der Klassifizierung eines neuen Objekts auf der Grundlage eines Attributs gibt jeder Baum im Zufallswald zunächst seine eigene Klassifizierungsauswahl ab und „stimmt“ dafür. Bei Klassifizierungsproblemen ist die Ausgabe des Waldes die mit den meisten Stimmen. Bei Regressionsproblemen ist die Ausgabe des Waldes der Durchschnitt der Ausgaben der Entscheidungsbäume.

Beim Random-Forest-Algorithmus ist „Zufall“ der Kern und „Forest“ lediglich eine Kombinationsmethode. Beim Erstellen jedes Baums verwendet der Wald normalerweise zwei bis drei Zufälligkeitsebenen, um die Unabhängigkeit jedes Baums sicherzustellen.

Random Forest-Funktionen

  • Vorteile: extrem hohe Genauigkeit, nicht leicht zu überanpassen, gute Rauschresistenz, kann hochdimensionale Daten ohne Merkmalsauswahl verarbeiten, kann diskrete und kontinuierliche Daten verarbeiten, Datensätze müssen nicht normalisiert werden, schnelle Trainingsgeschwindigkeit, kann eine Rangfolge der variablen Wichtigkeit erhalten und ist leicht zu parallelisieren.
  • Nachteile: komplexe Parameter, großer Platz- und Zeitaufwand für das Training und einige Bereiche des Modells können nicht erklärt werden.

Random Forest-Anwendung

  • Führen Sie Regressions- und Klassifizierungsaufgaben durch;
  • Wird verwendet, um fehlende Werte, Ausreißer und andere wichtige Schritte bei der Datenexploration zu behandeln;
  • Wird verwendet, um mehrere ineffiziente Modelle zu einem effizienten Modell zu kombinieren.
Übergeordnetes Wort: Bagging-Algorithmus
Unterwörter: Entscheidungsbaum

Verweise

【1】https://blog.csdn.net/qq547276542/article/details/78304454

【2】https://blog.csdn.net/lishuandao/article/details/52555103

【3】https://en.wikipedia.org/wiki/Random_forest

【4】http://dataunion.org/23602.html