Naive BayesEs handelt sich um einen Klassifizierungsalgorithmus, der auf der Wahrscheinlichkeitstheorie basiert. Anhand der Bayes-Formel kann es die Auftrittswahrscheinlichkeit jeder Kategorie vorhersagen und klassifizieren. Die Lösung besteht darin, die zu klassifizierenden Elemente entsprechend der Auftrittswahrscheinlichkeit jedes einzelnen Merkmals in der Kategorie in die Kategorie mit der höchsten Auftrittswahrscheinlichkeit aller Merkmale einzuordnen.
Naive Bayesianische Eigenschaften
Voraussetzung für die Verwendung von Naive Bayes ist, dass die zu klassifizierenden Merkmale gleich wichtig sind und keine Korrelation zueinander aufweisen.
Vorteil:
- Hohe Lern- und Vorhersageeffizienz, stabile Klassifizierungseffizienz und einfache Implementierung;
- Es ist auch dann noch wirksam, wenn weniger Daten vorhanden sind, und kann Mehrfachklassifizierungsprobleme bewältigen.
- Solange die Bedingung der Variablenunabhängigkeit erfüllt ist, ist die Leistung des Naive-Bayes-Klassifikators am besten.
- Im Vergleich zu anderen Klassifizierungsmethoden weist es die geringste Fehlerrate auf.
Mangel:
- Der Klassifizierungseffekt ist nicht besonders gut;
- Die Annahme der Merkmalsunabhängigkeit vereinfacht Naive Bayes, geht jedoch zu Lasten einer gewissen Klassifizierungsgenauigkeit.
- In der Praxis ist es schwierig, die Annahme unabhängiger Bedingungen zu erfüllen.
- Wenn die Kategorien einer kategorialen Variable im Trainingsdatensatz nicht immer beobachtet werden, kann keine Vorhersage getroffen werden.
Anwendungsszenarien und -praktiken
Es gibt normalerweise zwei Möglichkeiten, Naive Bayes zu implementieren: basierend auf dem Bernoulli-Modell und basierend auf dem Polynommodell.
Die Hauptanwendungen von Naive Bayes sind:
- Echtzeitvorhersage
- Multi-Klassen-Vorhersage
- Textklassifizierung / Spamfilterung / Sentimentanalyse
- Empfehlungssystem
Die Idee des naiven Bayes
Die Naive-Bayes-Methode berechnet, zu welcher Kategorie y x gehört. Der Ablauf ist wie folgt:
- Sei
ein zu klassifizierendes Element und jedes
ein charakteristisches Attribut von
; - Die zu klassifizierenden Kategorien sind die Menge
; - Berechnen Sie die Wahrscheinlichkeit, dass
zu
gehört: $latex {P{ \left( {y\mathop{{}}\nolimits_{{1}} \left| x\right. } \right) },\text{ }P{ \left( {y\mathop{{}}\nolimits_{{2}} \left| x\right. } \right) },\text{ }…,\text{ }P{ \left( {y\mathop{{}}\nolimits_{{n}} \left| - Wenn
klassifiziert ist.
Verwandte Wörter: Naive Bayes-Klassifikator