• Aucun résultat trouvé

Utilisations des r´eseaux bay´esiens causaux

1.2 R´eseaux bay´esiens et causalit´e

1.2.1 Utilisations des r´eseaux bay´esiens causaux

Pour d´efinir et distinguer deux types d’utilisations des r´eseaux bay´esiens causaux, il convient de s’arrˆeter `a un probl`eme soulev´e par la notion non interpr´et´ee de r´eseau bay´esien. Ce probl`eme est celui de la construction d’un graphe G repr´esentant une distribution de probabilit´es donn´ee, d´efinie sur un ensemble de variables. Ce probl`eme n’est pas trivial ; il est mˆeme g´en´eralement NP-complet.19 Toutefois on sait :

19

On montre par exemple que le probl`eme consistant `a construire un r´eseau bay´esien dans lequel chaque variable a au plus K parents et dont la probabilit´e ´etant donn´ee

1. le r´esoudre de mani`ere approch´ee pour un espace de recherche restreint. Plus pr´ecis´ement : ´etant donn´ees une mesure de la distance entre dis- tributions de probabilit´es d´efinies sur le mˆeme ensemble de variables et une classe de graphes orient´es acycliques, on sait construire le graphe qui, parmi ceux de cette classe, repr´esente la distribution de probabi- lit´es la plus proche d’une distribution p donn´ee 20;

2. le r´esoudre de fa¸con incompl`ete moyennant l’hypoth`ese de fid´elit´e : D´efinition 1.8 (Fid´elit´e) Soit (G, p) un r´eseau bay´esien. Il n’existe pas d’ind´ependances pour p autres que celles qui sont impliqu´ees par ceci que (G, p) est un r´eseau bay´esien.21

Sous cette hypoth`ese, on sait construire une repr´esentation graphique de l’ensemble des graphes orient´es acycliques qui repr´esentent une dis- tribution de probabilit´es donn´ee. Ce graphe acyclique, partiellement orient´e en g´en´eral, est usuellement appel´e « patron » (pattern). Les principaux algorithmes qui r´ealisent la tˆache de construction de pa- trons causaux se sont d´evelopp´es en deux s´eries parall`eles : d’un cˆot´e, les algorithmes IC et IC* de Verma et Pearl22, de l’autre les algorithmes

SGS, PC et PC* et CI et FCI de Spirtes, Glymour et Scheines23.

En rapport avec le probl`eme de la construction d’un graphe orient´e acy- clique repr´esentant une distribution de probabilit´es donn´ee, on peut iden- tifier et distinguer deux types d’utilisations des r´eseaux bay´esiens causaux. Dans les deux cas, les utilisations sont fond´ees sur ceci, que nous mettrons en ´evidence plus bas, que les hypoth`eses corr´elatives de la notion de r´eseau bay´esien causal semblent pouvoir ˆetre accept´ees. Dans le premier cas, on en tire l’id´ee selon laquelle une m´ethode rivale de celles que nous venons de pr´esenter consiste `a consid´erer le graphe qui donne une repr´esentation naturelle de la causalit´e sur un ensemble de variables comme repr´esentant les distributions de probabilit´es physiques sur cet ensemble. Dans le second cas, on en tire l’id´ee selon laquelle le graphe qu’on obtient en utilisant les m´ethodes du paragraphe pr´ec´edent est une repr´esentation naturelle des rela- tions de cause `a effet directes sur l’ensemble de variables consid´er´e. Pour les m´ethodes de type 2., il s’agit plus pr´ecis´ement d’une repr´esentation naturelle les donn´ees statistiques est sup´erieure `a un r´eel fix´e est un probl`eme NP-complet. Voir Chickering (1996).

20

Pour une pr´esentation synth´etique de la famille des m´ethodes que nous d´ecrivons, voir Leray (2005). Pour une pr´esentation d´etaill´ee d’une m´ethode de cette famille, voir Williamson (2005) sections 3.5 `a 3.11.

21

Pearl parle de « stabilit´e » plutˆot que de fid´elit´e (Pearl, 2000, p. 48).

22

Pour une pr´esentation, voir Pearl (2000) sections 2.5 et 2.6.

23

1.2. R´eseaux bay´esiens et causalit´e 37

de l’ensemble des relations de cause `a effet directes qu’on peut inf´erer des relations d’ind´ependance probabiliste entre les variables de V.

Le premier type d’utilisations des r´eseaux bay´esiens causaux est indisso- ciable du contexte d’apparition des r´eseaux bay´esiens que nous avons pr´esent´e dans la sous-section 1.1.1. Dans ce premier cas, la causalit´e est li´ee aux r´eseaux bay´esiens selon la modalit´e suivante : connaˆıtre les relations de cause `a effet directes sur un ensemble de variables facilite la tˆache qui consiste `a construire un graphe orient´e acyclique qui repr´esente une distribution de pro- babilit´es physiques sur cet ensemble. En d’autres termes, la causalit´e directe est consid´er´ee comme connue et joue le rˆole de guide pour la construction de graphes bay´esiens. On trouve une pr´esentation et une discussion de ce type d’utilisations des r´eseaux bay´esiens causaux dans la section 6 de Gillies (2002). Nous aurons `a y revenir plus loin dans le chapitre.

Le second type de contextes dans lesquels les r´eseaux bay´esiens cau- saux apparaissent d´erive des m´ethodes 2. pour la construction de graphes bay´esiens. Contrairement aux m´ethodes 1., les m´ethodes 2. ne contraignent pas a priori la forme du graphe bay´esien. Elles sont donc compatibles avec l’id´ee selon laquelle ce graphe repr´esente la causalit´e directe sur l’ensemble de variables consid´er´e. Autrement dit, les m´ethodes de type 2. sont utilis´ees comme des m´ethodes de construction de graphes causaux. Contrairement aux utilisations du premier type, celles du second type ne supposent donc pas connues les relations de cause `a effet directes entre les variables de l’en- semble consid´er´e. Ces relations sont mˆeme ce qu’on escompte apprendre – au moins partiellement – de la construction de l’ensemble des graphes orient´es acycliques repr´esentant une distribution de probabilit´es donn´ee sur un en- semble de variables V. En d’autres termes, les r´eseaux bay´esiens causaux apparaissent en second lieu dans un contexte d’inf´erence causale. Le lec- teur aura compris que ce second contexte est celui qui nous int´eresse dans cette premi`ere partie de notre travail. Avant d’en venir sp´ecifiquement `a lui, il convient toutefois de proposer une discussion g´en´erale de l’hypoth`ese de repr´esentation d’abord et de la condition de Markov causale ensuite.