HyperAI

Bayes Naïf

Bayes naïfIl s'agit d'un algorithme de classification basé sur la théorie des probabilités. Selon la formule bayésienne, il peut prédire et classer la probabilité d’occurrence de chaque catégorie. La solution consiste à classer les éléments à classer dans la catégorie avec la probabilité d’occurrence la plus élevée de toutes les caractéristiques en fonction de la probabilité d’occurrence de chaque caractéristique dans la catégorie.

Propriétés bayésiennes naïves

La condition préalable à l’utilisation de Naive Bayes est que les caractéristiques à classer soient d’égale importance et n’aient aucune corrélation entre elles.

avantage:

  • Haute efficacité d'apprentissage et de prédiction, efficacité de classification stable et facile à mettre en œuvre ;
  • Il est toujours efficace lorsqu’il y a moins de données et peut gérer les problèmes de multi-classification ;
  • Tant que la condition d’indépendance des variables est respectée, le classificateur naïf de Bayes est le plus performant ;
  • Il présente le taux d’erreur le plus faible par rapport aux autres méthodes de classification.

défaut:

  • L’effet de classification n’est pas particulièrement bon ;
  • L’hypothèse d’indépendance des caractéristiques rend Naive Bayes plus simple, mais elle sacrifiera un certain degré de précision de classification ;
  • En pratique, il est difficile de satisfaire l’hypothèse de conditions indépendantes ;
  • Si les catégories d’une variable catégorielle ne sont pas toujours observées dans l’ensemble de données d’entraînement, aucune prédiction ne peut être faite.

Scénarios et pratiques d'application

Il existe généralement deux manières d'implémenter Naive Bayes : en se basant sur le modèle de Bernoulli et en se basant sur le modèle polynomial.

Les principales applications de Naive Bayes sont :

  • Prédiction en temps réel
  • Prédiction multi-classes
  • Classification de texte / filtrage anti-spam / analyse des sentiments
  • Système de recommandation

L'idée de Bayes naïf

La méthode Naive Bayes calcule à quelle catégorie appartient y x. Le processus est le suivant :

  1. Soit un élément à classer, et chaque est un attribut caractéristique de ;
  2. Les catégories à classer sont l'ensemble ;
  3. Calculer la probabilité que appartienne à : $latex {P{ \left( {y\mathop{{}}\nolimits_{{1}} \left| x\right. } \right) },\text{ }P{ \left( {y\mathop{{}}\nolimits_{{2}} \left| x\right. } \right) },\text{ }…,\text{ }P{ \left( {y\mathop{{}}\nolimits_{{n}} \left|
  4. Si .
Mots apparentés : classificateur bayésien naïf