HyperAI

Naive Bayes

Naive BayesEs handelt sich um einen Klassifizierungsalgorithmus, der auf der Wahrscheinlichkeitstheorie basiert. Anhand der Bayes-Formel kann es die Auftrittswahrscheinlichkeit jeder Kategorie vorhersagen und klassifizieren. Die Lösung besteht darin, die zu klassifizierenden Elemente entsprechend der Auftrittswahrscheinlichkeit jedes einzelnen Merkmals in der Kategorie in die Kategorie mit der höchsten Auftrittswahrscheinlichkeit aller Merkmale einzuordnen.

Naive Bayesianische Eigenschaften

Voraussetzung für die Verwendung von Naive Bayes ist, dass die zu klassifizierenden Merkmale gleich wichtig sind und keine Korrelation zueinander aufweisen.

Vorteil:

  • Hohe Lern- und Vorhersageeffizienz, stabile Klassifizierungseffizienz und einfache Implementierung;
  • Es ist auch dann noch wirksam, wenn weniger Daten vorhanden sind, und kann Mehrfachklassifizierungsprobleme bewältigen.
  • Solange die Bedingung der Variablenunabhängigkeit erfüllt ist, ist die Leistung des Naive-Bayes-Klassifikators am besten.
  • Im Vergleich zu anderen Klassifizierungsmethoden weist es die geringste Fehlerrate auf.

Mangel:

  • Der Klassifizierungseffekt ist nicht besonders gut;
  • Die Annahme der Merkmalsunabhängigkeit vereinfacht Naive Bayes, geht jedoch zu Lasten einer gewissen Klassifizierungsgenauigkeit.
  • In der Praxis ist es schwierig, die Annahme unabhängiger Bedingungen zu erfüllen.
  • Wenn die Kategorien einer kategorialen Variable im Trainingsdatensatz nicht immer beobachtet werden, kann keine Vorhersage getroffen werden.

Anwendungsszenarien und -praktiken

Es gibt normalerweise zwei Möglichkeiten, Naive Bayes zu implementieren: basierend auf dem Bernoulli-Modell und basierend auf dem Polynommodell.

Die Hauptanwendungen von Naive Bayes sind:

  • Echtzeitvorhersage
  • Multi-Klassen-Vorhersage
  • Textklassifizierung / Spamfilterung / Sentimentanalyse
  • Empfehlungssystem

Die Idee des naiven Bayes

Die Naive-Bayes-Methode berechnet, zu welcher Kategorie y x gehört. Der Ablauf ist wie folgt:

  1. Sei ein zu klassifizierendes Element und jedes ein charakteristisches Attribut von ;
  2. Die zu klassifizierenden Kategorien sind die Menge ;
  3. Berechnen Sie die Wahrscheinlichkeit, dass zu gehört: $latex {P{ \left( {y\mathop{{}}\nolimits_{{1}} \left| x\right. } \right) },\text{ }P{ \left( {y\mathop{{}}\nolimits_{{2}} \left| x\right. } \right) },\text{ }…,\text{ }P{ \left( {y\mathop{{}}\nolimits_{{n}} \left|
  4. Wenn klassifiziert ist.
Verwandte Wörter: Naive Bayes-Klassifikator