Réseau Bayésien
définition
Le réseau bayésien est actuellement l’un des modèles théoriques les plus efficaces dans le domaine de l’expression et du raisonnement des connaissances incertaines. Un réseau bayésien est constitué de nœuds représentant des variables et d'arêtes dirigées reliant ces nœuds.
Les nœuds représentent des variables aléatoires et les arêtes dirigées entre les nœuds représentent les relations entre les nœuds. La probabilité conditionnelle est utilisée pour exprimer la force de la relation, et la probabilité a priori est utilisée pour exprimer des informations sur les nœuds sans nœuds parents.
Définition mathématique
Soit G = (I,E) représentant un graphe acyclique orienté (DAG), où I représente l'ensemble de tous les nœuds du graphe, et E représente l'ensemble des segments de connexion orientés, et soit X = (Xi)i∈I la variable aléatoire représentée par un nœud i dans le graphe acyclique orienté. Si la distribution de probabilité conjointe du nœud X peut être exprimée comme :

Alors X est appelé un réseau bayésien relatif à un graphe acyclique orienté G, où pa(i)Représente la « cause » du nœud i.
Pour toute variable aléatoire, sa distribution conjointe peut être obtenue en multipliant leurs distributions de probabilité conditionnelles locales respectives :

Selon la formule ci-dessus, nous pouvons écrire la distribution de probabilité conjointe d'un réseau bayésien comme :

La différence entre les deux expressions ci-dessus réside dans la partie probabilité conditionnelle. Dans le réseau bayésien, si la variable « dépendante » est connue, certains nœuds seront conditionnellement indépendants de leur variable « dépendante ». Seuls les nœuds liés à la variable « dépendante » auront une probabilité conditionnelle.
Si le nombre de dépendances dans la distribution conjointe est faible, la méthode bayésienne peut économiser une capacité de mémoire considérable. Par exemple, si nous voulons stocker 10 variables dont les valeurs sont toutes 0 ou 1 dans un tableau de probabilités conditionnelles, une idée intuitive est que nous devons calculer un total de 2^10=1024 valeurs; Cependant, si aucune des 10 variables n'a plus de trois variables dépendantes, alors le tableau de probabilité conditionnelle du réseau bayésien n'a besoin de calculer que 10* 2^3=80 Une valeur suffit.
fonctionnalité
- Le réseau bayésien lui-même est un modèle d’association causale indéterminée ;
- Les réseaux bayésiens ont de puissantes capacités pour gérer des problèmes incertains ;
- Les réseaux bayésiens peuvent exprimer et fusionner efficacement des informations multi-sources.