Deux r´esultats fondamentaux - Causalité et probabilités : réseaux bayésiens, propensionnisme

Les deux résultats que nous présentons dans cette sous-section sont fondamentaux au moins au sens où ils portent sur la notion de représentation d’une distribution de probabilités par un graphe qu’on trouve au fondement de la définition 1.4 des réseaux bayésiens.

1.1.3.1 Condition de Markov

Le premier des résultats que nous présentons consiste dans une équivalence entre la représentation d’une distribution de probabilités par un graphe et une autre condition, appelée « condition de Markov ». Ce résultat est le suivant :

Proposition 1.1 (Pearl, 1988) Soit V un ensemble de variables, G un graphe orienté acyclique sur V et p une distribution de probabilités sur V. G représente p si et seulement si chaque variable de V est indépendante pour p de tous ses non-descendants dans G relativement à ses parents dans G.11

Ainsi que nous l’avons déjà partiellement indiqué, on appelle « condition de Markov parentale » ou plus simplement « condition de Markov » la condition nécessaire et suffisante de représentation d’une distribution de probabilités par un graphe qui est énoncée dans la proposition 1.1 :

Dans tous les cas, l’ensemble de parents markoviens que nous donnons est en fait unique.

On convient qu’une variable n’appartient pas `a l’ensemble de ses non-descendants graphiques.

1.1. Présentation des réseaux bayésiens 25

Définition 1.5 (Condition de Markov) Soit V un ensemble de variables, G un graphe orienté acyclique sur V et p une distribution de proba- bilités sur V.

Le couple (G, p) satisfait la condition de Markov si toute variable de V est ind´ependante de tous ses non-descendants dans G relativement `a l’ensemble de ses parents dans G.

Etant équivalente à la condition de représentation mobilisée dans la définition 1.4, elle peut lui être substituée pour produire une définition alternative des réseaux bayésiens.12 _{La condition de Markov fait l’objet d’une grande partie}

des discussions contemporaines portant sur les réseaux bayésiens en général et les réseaux bayésiens causaux en particulier.

1.1.3.2 d-s´eparation

Le second des résultats que nous présentons dans cette sous-section ex- plore la correspondance entre un graphe orienté acyclique et les distributions de probabilités qu’il représente.

d-s´eparation d’un chemin.

Définition 1.6 (d -séparation d’un chemin) Dans un graphe orienté acyclique G sur un ensemble de variables V, un chemin c est d-séparé par un sous-ensemble W de V si l’une des deux propositions suivantes est vraie : 1. c contient une chaˆıne Vi −→ Vj −→ Vkou une fourche Vi ←− Vj −→ Vk

telle que Vj appartient W ;

2. c contient une fourche invers´ee Vi −→ Vj ←− Vk telle que ni Vj, ni

aucun de ses descendants n’appartient `a W.

A titre d’illustration, notons les d-s´eparations suivantes dans les graphes G1,

G2 et G3 ci-dessus :

Dans G1, le chemin qui va de W à Z est d-séparé par {Y } en vertu du premier

disjoint de la clause 1.

Dans G3, le chemin entre X et Z est d-s´epar´e par {W, Y } en vertu du second

disjoint de la clause 1.

Dans G2, le chemin entre W et Y est d-s´epar´e par {X} en vertu de la clause

La condition de Markov est utilisée pour définir les réseaux bayésiens par plusieurs auteurs. Voir par exemple Williamson (2005) pp. 14-16.

d-séparation de deux ensembles de variables. La définition 1.6 donnée dans le paragraphe précédent nous permet de définir une relation ternaire de d -séparation entre ensembles de variables d’un graphe orienté acyclique :

D´efinition 1.7 Soit un graphe orient´e acyclique G sur un ensemble de variables V et W, X et Y trois sous-ensembles de V.

Y d-sépare W et X dans G si tout chemin d’une variable de W à une variable de X est d-séparé par Y.

Revenons, `a nouveau, `a notre exemple. Dans le graphe G2, {W } et {Y }

sont d-séparés par {X} en vertu de ce qui a été mis en évidence dans le paragraphe pécédent. Dans ce même graphe, on notera aussi – et entre autres – la d-séparation de {W, Z} par {X, Y }.

On notera que la notion de d -séparation, de même que celle d’indépendance probabiliste relative, est symétrique : Y d -sépare W de X dans G si et seulement si Y d -sépare X de W dans G.

Second résultat fondamental relatif aux réseaux bayésiens. La notion de d -séparation entre ensembles de variables permet d’énoncer une pro- priété importante de la correspondance entre un graphe orienté acyclique et les distributions de probabilités qu’il représente :

Théorème 1.1 (Verma et Pearl, 1988) Soit G un graphe acyclique orienté sur un ensemble de variables V et soit W, X et Y trois sous- ensembles de V.

W et X sont d-séparés par Y dans G si et seulement si W est indépendant de X relativement à Y pour toute distribution de probabilités représentée par G.

La d -séparation dans un graphe G correspond donc exactement à l’indépendance probabiliste pour toutes les distributions de probabilités représentées par G. Il en découle immédiatement que la d -séparation dans le graphe G d’un réseau bayésien (G, p) implique l’indépendance probabiliste pour p. Ainsi, la d-séparation dans le graphe G2 ci-dessus implique

l’indépendance probabiliste relative pour la distribution de probabilités p impliquée par la description proposée pour la situation. Parce que (G2, p) est

un réseau bayésien, la propriété graphique de d-séparation dans G2 devient

un crit`ere d’ind´ependance probabiliste relative pour p.

Dans les deux sous-sections qui s’achèvent ici, nous avons défini les réseaux bayésiens et présenté deux résultats fondamentaux les concernant.

1.1. Présentation des réseaux bayésiens 27

Armés de cela, nous pouvons revenir à la question du traitement de l’incerti- tude. Plus généralement, nous pouvons maintenant en venir aux applications qu’autorise la notion de réseaux bayésiens. En d’autres termes, nous en ve- nons maintenant aux utilisations des réseaux bayésiens.

Dans le document Causalité et probabilités : réseaux bayésiens, propensionnisme (Page 41-44)