Nach Dem Beschneiden
NachschnittBezieht sich auf den Beschneidungsvorgang, der nach der Generierung des Entscheidungsbaums durchgeführt wird. Diese Methode basiert auf dem vollständigen Entscheidungsbaum und ermöglicht eine Überanpassung des Baums an die Trainingsdaten. Bei Knotenwörtern mit unzureichender Konfidenz wird der Teilbaum durch einen Blattknoten ersetzt und die Klassenbezeichnung des Blattes mit der häufigsten Klasse im Knotenteilbaum markiert.
Der Post-Pruning-Prozess besteht darin, eine Gruppe von Knoten mit demselben übergeordneten Knoten zu überprüfen, um festzustellen, ob der Entropieanstieg bei einer Zusammenführung unter einem bestimmten Schwellenwert liegt. Wenn der Schwellenwert klein ist, kann eine Gruppe von Knoten zu einem einzigen zusammengeführt werden, der alle möglichen Ergebnisse enthält.
Nachschnittmethode
Teilen Sie die Testdaten basierend auf dem vorhandenen Baum auf:
- Wenn eine beliebige Teilmenge ein Baum ist, führen Sie den Beschneidungsprozess rekursiv für diese Teilmenge durch.
- Berechnen Sie die nicht kombinierten Fehler.
- Wenn durch das Zusammenführen der Fehler verringert wird, führen Sie die Blattknoten zusammen.
Liste der Post-Pruning-Algorithmen
1) Fehlerreduziertes Beschneiden (REP);
2) Pessimistische Beschneidungskosten EBP (Error-Based Pruning);
3) Kosten-Komplexitäts-Beschneidung (CCP);
4) Fehlerbasiertes Beschneiden PEP (Pesimistic-Error Pruning).
Vergleich zwischen Vorschnitt und Nachschnitt
Die Einstellung des vorderen Schwellenwerts ist sehr empfindlich und eine kleine Änderung führt zu Änderungen im gesamten Baum. Im Vergleich dazu führt das Nachbeschneidungsschema zu besseren Ergebnissen.
Beim Nachbeschneiden bleiben mehr Äste erhalten und es besteht ein geringeres Risiko einer Unteranpassung als beim Vorbeschneiden. Das Post-Pruning basiert jedoch auf dem trainierten Entscheidungsbaum und verwendet eine Bottom-up-Schicht-für-Schicht-Scanmethode. Daher sind der Trainingsaufwand und die Kosten höher als beim Vorbeschneiden.
Im Vergleich zum Frontschnitt sind Nachschnittverfahren häufiger anzutreffen, vor allem, weil sich bei Frontschnittmethoden der Zeitpunkt zum Stoppen des Baumwachstums schwieriger genau abschätzen lässt.