• Aucun résultat trouvé

D’o` u viennent les r´eseaux bay´esiens ?

Les r´eseaux bay´esiens sont apparus dans la premi`ere moiti´e des ann´ees 1980 et en intelligence artificielle. Plus pr´ecis´ement, ils ont ´et´e introduits dans

ce champ comme des outils de traitement de l’incertitude. D`es lors, com- prendre d’o`u viennent les r´eseaux bay´esiens implique de faire retour d’abord sur la question du traitement de l’incertitude en intelligence artificielle.

1.1.1.1 Traitements de l’incertitude en intelligence artificielle La question du traitement de l’incertitude a ´emerg´e en intelligence artifi- cielle dans les ann´ees 1970, corr´elativement du projet de cr´eation de syst`emes experts. Un syst`eme expert est un programme informatique qui reproduit les m´ecanismes cognitifs d’experts d’un domaine particulier – et pourraient donc servir d’aide `a la d´ecision dans ce domaine. Le projet de cr´eation de syst`emes experts soul`eve la question du traitement de l’incertitude dans la mesure o`u les raisonnements humains en g´en´eral et les raisonnements d’experts en par- ticulier sont des raisonnements en situation d’incertitude, relativement `a des ´enonc´es susceptibles d’exceptions, selon des r`egles d´efaisables...

L’un des premiers syst`emes experts est le syst`eme MYCIN pour le diag- nostic des infections sanguines, d´evelopp´e `a Stanford par Shortliffe, Buchanan et d’autres au d´ebut des ann´ees 1970. MYCIN repose sur une base de donn´ees (knowledge base) constitu´ee de r`egles de la forme : Si le patient pr´esente tel et tel symptˆomes, alors une conclusion raisonnable est telle ou telle. A titre d’illustration, Buchanan et Shortliffe indiquent la r`egle suivante1 :

IF : The stain of the organism is gram positive, and The morphology of the organism is coccus, and The growth conformation of the organism is chains THEN : There is suggestive evidence (.7) that the identity

of the organism is streptococcus.

Il apparaˆıt alors que l’incertitude est prise en compte sous la forme quantita- tive de l’attribution d’un degr´e `a la conclusion autoris´ee par la r`egle. Ce degr´e est d´etermin´e empiriquement, `a partir de la consultation d’experts. Il prend ses valeurs dans l’intervalle [0 ; 1] mais n’est pas la probabilit´e conditionnelle du cons´equent de la r`egle relativement `a son ant´ec´edent :

interroger l’expert r´ev`ele graduellement que malgr´e son apparente si- milarit´e avec une affirmation concernant une probabilit´e condition- nelle, le nombre 0.7 diff`ere significativement d’une probabilit´e. L’ex- pert peut bien accorder que P (h1|s1, s2, s3) = 0.7, mais il devient mal

`

a l’aise quand il essaie d’en tirer la conclusion logique que, du coup, P(¬h1|s1, s2, s3) = 0.3. Il affirme que les trois observations plaident

(au degr´e 0.7) en faveur de la conclusion que l’organisme est un Strep- tococcuset ne devraient pas ˆetre consid´er´ees comme plaidant (au degr´e 0.3) contre la conclusion que c’est un Streptococcus. [...]

1

1.1. Pr´esentation des r´eseaux bay´esiens 19

Il est tentant de conclure que l’expert est irrationnel puisqu’il ne veut pas accepter les implications de ses affirmations probabilistes `a leurs conclusions logiques. Une autre interpr´etation, cependant, est que les nombres qu’il a donn´es ne doivent pas ˆetre consid´er´es comme des pro- babilit´es du tout, qu’ils sont des mesures de jugement qui refl`etent un degr´e de croyance.2

Les auteurs adoptent cette derni`ere interpr´etation et construisent le concept dyadique de confirmation non probabiliste dont ils ont besoin. Ils parlent de « facteurs de certitude ».

1.1.1.2 Caract´eristiques du traitement de l’incertitude au moyen des r´eseaux bay´esiens

Le traitement de l’incertitude qu’autorisent les r´eseaux bay´esiens est si- milaire `a celui qui est `a l’oeuvre dans les syst`emes experts du type de MY- CIN sur le point suivant : il n’est pas logique, mais repose sur l’introduction d’un concept num´erique. En cela, les deux traitements de l’incertitude se distinguent ensemble de celui qui est offert par les logiques non-monotones. Toutefois, au-del`a de cette premi`ere convergence, le traitement de l’incer- titude par les r´eseaux bay´esiens diff`ere de celui qui est `a l’oeuvre dans les syst`emes tels MYCIN par deux aspects fondamentaux. En premier lieu, le concept num´erique sur lequel repose le traitement de l’incertitude dans les r´eseaux bay´esiens est probabiliste. Du coup, il rend disponible toute la th´eorie classique des probabilit´es.

En second lieu, mais surtout, ce concept num´erique n’est pas manipul´e de la mˆeme fa¸con dans MYCIN et dans un r´eseau bay´esien. Dans MYCIN, les facteurs de certitude sont attribu´es `a des hypoth`eses sur la base de r`egles lo- cales du type de celle que nous venons de mentionner. Le facteur de certitude attach´e `a une hypoth`ese d´ecoule des informations sous une r`egle locale. Dans cette mesure, on peut consid´erer que les facteurs de certitude g´en´eralisent la notion de degr´e de v´erit´e. A l’inverse, dans les r´eseaux bay´esiens, les ´etats du monde ont d’embl´ee des probabilit´es, qui varient en fonction des informations obtenues et selon le principe g´en´eral de la conditionalisation bay´esienne. La variation des probabilit´es est globale au sens o`u une nouvelle information implique la r´evision de toutes les probabilit´es. Pearl parle d’un traitement s´emantique de l’incertitude dans les r´eseaux bay´esiens, et l’oppose au traite- ment syntaxique3 qui est `a l’oeuvre dans un syst`eme expert du mˆeme type

que MYCIN.4 2 Shortliffe et Buchanan (1984) p. 239. 3 Pearl (1988) p. 3. 4

Le principal attrait des traitements syntaxiques de l’incertitude est com- putationnel. Du caract`ere local des r`egles de la base de connaissance, il d´ecoule en effet qu’il est possible de d´efinir une proc´edure modulaire pour d´eterminer le facteur de certitude associ´e au cons´equent de la r`egle. La prin- cipale contre-partie de cette facilit´e computationnelle r´eside dans la n´ecessit´e de d´efinir des r`egles tr`es nombreuses pour prendre en compte les exceptions aux r`egles.5 A l’inverse, les traitements s´emantiques se heurtent `a l’obstacle

computationnel :

puisque la syntaxe n’indique aucune proc´edure utile, nous de- vons construire des m´ecanismes sp´eciaux pour convertir les entr´ees d´eclaratives en des routines pour r´epondre `a des questions.6

Cela suppose de contourner l’obstacle du caract`ere global des cons´equences de l’acquisition d’information dans le contexte s´emantique.

Dans les r´eseaux bay´esiens, ce contournement s’effectue au moyen d’un « truc » :

Le truc, d`es lors, est d’encoder les connaissances de telle sorte que ce qu’on peut ignorer est reconnaissable (the ignorable is recognizable) ou, mieux encore, que ce qu’on peut ignorer est identifi´e rapidement et accessible facilement.7

L’encodage qui convient est graphique. Ainsi, les r´eseaux bay´esiens com- portent des graphes sur lesquels on peut lire ce qui peut ˆetre ignor´e et, positivement, ce qui doit ˆetre pris en compte `a l’occasion de la r´evision de la probabilit´e d’un ´etat du monde donn´e. Il apparaˆıt alors que la composante graphique des r´eseaux bay´esiens est essentielle au traitement s´emantique de l’incertitude qu’ils v´ehiculent. A l’inverse, les graphes qui sont mobilis´es dans le contexte syntaxique sont toujours des auxiliaires et jamais porteurs d’in- formations indispensables pour mener l’inf´erence.

Nous avons d´ecrit le paysage th´eorique dans lequel les r´eseaux bay´esiens apparaissent. Plus pr´ecis´ement, nous avons qualifi´e la r´eponse que les r´eseaux bay´esiens apportent `a la question du traitement de l’incertitude en intelli- gence artificielle. Il nous reste `a comprendre les d´etails de cette r´eponse. Cela du traitement de l’incertitude dans MYCIN au caract`ere non probabiliste du concept num´erique utilis´e pour traiter l’incertitude. Ainsi PROSPECTOR est-il un syst`eme ex- pert alli´e strat´egie syntaxique et probabilit´es. R´eciproquement, des concepts num´eriques non probabilistes peuvent ˆetre utilis´es dans le cadre d’un traitement s´emantique de l’in- certitude.

5

Pour une pr´esentation des autres contre-parties de l’int´erˆet computationnel des ap- proches syntaxiques, voir Pearl (1988) sous-section 1.2.2.

6

Pearl (1988) p. 12.

7

1.1. Pr´esentation des r´eseaux bay´esiens 21

ne sera possible qu’apr`es avoir d´efini rigoureusement les r´eseaux bay´esiens et pr´esent´e les r´esultats fondamentaux qui les concernent. Nous le faisons dans les deux prochaines sous-sections.