• Aucun résultat trouvé

Proc´edure d’inf´erence causale RB

2.1 Caract´erisation RB de la causalit´e

3.1.1 Proc´edure d’inf´erence causale RB

Nous avons choisi de commencer par pr´esenter ici les proc´edures d’inf´erence causale parce que les algorithmes d’inf´erence causale fond´es sur les r´eseaux bay´esiens nous donnent la prise la plus ferme sur ce qu’est l’inf´erence causale RB. Dans ces conditions, il est naturel que nous commencions par pr´esenter pr´ecis´ement ces algorithmes.

3.1.1.1 Algorithmes d’inf´erence causale RB

Ainsi que nous l’avons indiqu´e d´ej`a dans la sous-section 1.2.1, les algo- rithmes d’inf´erence aux causes fond´es sur les r´eseaux bay´esiens (« algorithmes RB » dans la suite) se sont d´evelopp´es en deux s´eries parall`eles : d’un cˆot´e, les algorithmes IC et IC* de Verma et Pearl, de l’autre les algorithmes SGS, PC et PC*, et CI et FCI de Spirtes, Glymour et Scheines. Parmi ces algorithmes, nous pr´esentons le seul algorithme PC de Spirtes, Glymour et Scheines. La raison pour laquelle nous pouvons nous contenter de pr´esenter un seul des nombreux algorithmes RB est la suivante : dans tous les cas, le principe de l’inf´erence causale – qui est ce qui nous int´eresse finalement – est le mˆeme. Maintenant, le choix de l’algorithme PC repose sur deux consid´erations non ind´ependantes. D’une part PC est l’algorithme qu’utilisent les plus connus des programmes informatiques d’inf´erence causale RB – les programmes de la famille TETRAD. D’autre part PC, et plus g´en´eralement les algorithmes de Spirtes, Glymour et Scheines, ont donn´e lieu aux d´ebats les plus nourris de la litt´erature philosophique consacr´ee aux algorithmes RB.1

L’algorithme PC est introduit dans Spirtes et al. (1991) et pr´esent´e dans Spirtes et al. (1993)2. C’est `a cette pr´esentation que nous nous r´ef´erons. Il

s’agit d’un algorithme qui vise l’inf´erence aux causes dans les ensembles de variables « causalement suffisants », c’est-`a-dire tels que toute variable qui est une cause commune `a au moins deux variables de l’ensemble est elle-mˆeme une variable de l’ensemble. Cette restriction est lev´ee par l’algorithme CI3. En

nous int´eressant `a PC plutˆot qu’`a CI, nous limitons les consid´erations tech- niques au minimun n´ecessaire pour traiter les probl`emes qui nous int´eressent, au niveau d’abstraction depuis lequel nous les abordons. Corr´elativement au choix de pr´esenter PC, la question de la s´election des variables qu’il convient de consid´erer lors de l’´etude de la causalit´e dans un syst`eme r´eel donn´e n’est pas abord´ee dans le pr´esent chapitre.

1

En particulier, la querelle qui se d´eroule au long de Humphreys et Freedman (1996), Spirtes et al. (1997), Korb et Wallace (1997), Freedman et Humphreys (1999) concerne sp´ecifiquement l’algorithme PC et les programmes de la famille TETRAD.

2

Spirtes et al. (1993) pp. 84–85.

3

L’entr´ee (input) de l’algorithme PC est une distribution de probabilit´es p sur un ensemble de variables V ; son r´esultat (output) est un graphe acy- clique partiellement orient´e – ou « patron » – sur V. PC se compose de quatre instructions. Ces instructions ne nous int´eressent pas ici en tant que telles, mais seulement en tant qu’elles composent une proc´edure dont nous extrairons le principe de l’inf´erence causale RB. D`es lors, nous renvoyons le lecteur int´eress´e par leur d´etail technique `a Spirtes et al. (1993)4et nous nous

contentons d’expliquer ce qu’il s’agit de faire `a chaque ´etape. ´

Etant donn´ee une distribution de probabilit´es sur un ensemble de va- riables V, PC commande de :

´

Etape 1 : Former sur V le graphe non orient´e complet (c’est-`a-dire tel que chaque variable de V est reli´ee `a chaque autre variable de V par une arˆete), et noter C1 ce graphe.

´

Etape 2 : Retirer de C1 toutes les arˆetes entre deux variables X et Y pour

lesquelles il existe un ensemble de variables de V \{X, Y } relativement au- quel elles sont ind´ependantes, et noter C2 le graphe obtenu.

´

Etape 3 : Remplacer par X → Y ← Z tout sous-graphe X — Y — Z de C2, tel que X et Z sont ind´ependants relativement `a Y , et noter C3 le graphe

obtenu. ´

Etape 4 : Orienter toutes les arˆetes de C3 qui peuvent l’ˆetre sans qu’aucun

sous-graphe de la forme X → Y ← Z, ni aucun cycle ne soit cr´e´e, et noter GIV le r´esultat.

GIV est le r´esultat donn´e par PC.

3.1.1.2 Identifier les ind´ependances probabilistes relatives

Avant d’aller plus loin, il convient de remarquer que la proc´edure d’inf´erence causale que nous venons de d´ecrire requiert que soient identifi´ees les ind´ependances probabilistes relatives entre les variables de l’ensemble V consid´er´e. Pour des raisons computationnelles ´evidentes, ces ind´ependances probabilistes ne sont pas identifi´ees toutes avant le commencement de la proc´edure PC. Elles sont identifi´ees `a l’occasion de l’´etape 2 et dans l’ordre suivant : d’abord les ind´ependances probabilistes absolues, ensuite les ind´ependances probabilistes relatives `a une variable entre variables qui ne sont pas ind´ependantes absolument, puis les ind´ependances probabilistes relatives `a deux variables entre variables qui ne sont ind´ependantes ni abso- lument ni relativement `a une variable...

Pour ce qui est de la proc´edure d’identification des ind´ependances pro- babilistes relatives, il convient de distinguer deux cas. Si on connaˆıt la dis-

4

3.1. Inf´erence causale fond´ee sur les r´eseaux bay´esiens 117

tribution de probabilit´es sur l’ensemble de variables et dans la population consid´er´es, alors identifier les ind´ependances probabilistes revient `a compa- rer les valeurs de probabilit´es conditionnelles. Toutefois, dans la pratique r´eelle de l’inf´erence causale, il arrive rarement qu’on connaisse la distribu- tion de probabilit´es dans la population. Positivement, on dispose en g´en´eral de fr´equences relatives dans un ´echantillon de la population. Il faut alors re- courir `a des tests statistiques d’hypoth`eses de la forme « X est ind´ependant de Y relativement `a V’ dans la population consid´er´ee » o`u X et Y sont des variables de V et V’ un sous-ensemble de V \{X, Y }. Ces tests d´ependent de la forme suppos´ee de la distribution des diff´erentes propri´et´es dans la po- pulation. On notera que l’ind´ependance probabiliste relative est ´equivalente `a l’annulation des corr´elations partielles sous les deux hypoth`eses de norma- lit´e des distributions des variables et de lin´earit´e des relations fonctionnelles entre les variables.