• Aucun résultat trouvé

1.5 Les r´ eseaux bay´ esiens

1.5.1 Principes g´ en´ eraux

Le domaine des r´eseaux bay´esiens a la particularit´e d’associer deux domaines math´ematiques pour repr´esenter l’incertitude :

– la th´eorie des graphes qui permet une mod´elisation qualitative de la connaissance, – la th´eorie des probabilit´es pour traiter de mani`ere quantitative les connaissances.

Ainsi, les r´eseaux bay´esiens rassemblent et fusionnent les connaissances de diverses natures dans un mˆeme mod`ele sous plusieurs formes : le retour d’exp´erience grˆace aux donn´ees empiriques d´ej`a obtenues et l’expertise exprim´ee sous formes de r`egles logiques, d’´equations ou encore de probabilit´es subjectives.

1.5.1.1 Phase de construction

Ces r´eseaux utilisent un graphe causal (noeuds reli´es par des arcs de relations de d´ependance) dans lequel une observation introduite sur une variable se r´epercute sur l’´etat des autres variables. La construction du r´eseau s’effectue en trois ´etapes pr´esent´ees dans le tableau1.2.

Dans la premi`ere ´etape, l’utilisateur d´efinit l’ensemble des variables du syst`eme, en pr´ecisant l’espace d’´etats de chaque variable, `a savoir l’ensemble de ses valeurs possibles. En g´en´eral, les variables consid´er´ees sont al´eatoires mais il est possible d’introduire des valeurs d´eterministes li´ees `a des observations particuli`eres ou simplement pour la compr´ehension globale du syst`eme. Dans le cas de grandeurs physiques, les variables seront d´efinies sur une plage d’observations probables donn´ee par l’expert. Il est `a noter que la plupart des logiciels de r´eseaux bay´esiens fonctionnent avec des variables discr`etes : les variables continues devront donc ˆetre judicieuse-

ment discr´etis´ees pour un optimum entre pr´ecision des observations et saturation de l’espace m´emoire machine dans le traitement du r´eseau.

1. Identification des variables et de leurs espaces d’´etats

2. D´efinition de la structure du r´eseau bay´esien

3. D´efinition de la loi de probabilit´e conjointe des variables

Tab. 1.2 – Etapes de la construction d’un r´eseau bay´esien [Na¨ım et al., 2007]

Dans la structure du r´eseau, l’utilisateur identifie les liens entre les diff´erentes variables, l`a encore sous le contrˆole de l’expert. Il s’agit simplement de relier des causes et des effets par des fl`eches orient´ees. Cependant s’il existe une relation causale de A vers B, toute information sur A peut modifier la connaissance sur B et r´eciproquement. L’information ne circule pas uniquement dans le sens des fl`eches. L’ensemble des noeuds et des fl`eches forme la structure du r´eseau bay´esien : c’est donc la repr´esentation qualitative de la connaissance.

La derni`ere ´etape de construction consiste `a affecter `a chaque noeud une table de probabilit´e qui repr´esente la distribution locale de probabilit´e. Suivant le type de noeuds, deux cas de figure se pr´esentent :

– si la variable n’a pas de cause, l’expert d´efinit alors la loi de probabilit´e marginale associ´ee (lui-mˆeme ou `a partir d’observations).

– Si la variable poss`ede diff´erentes causes, l’expert doit pr´eciser la d´ependance en fonction de ces causes par une table de probabilit´es conditionn´ees qu’il exprime directement, ou par des relations d´eterministes qui conduisent au calcul de cette table, grˆace `a des simulations de Monte-Carlo notamment.

Cette derni`ere ´etape constitue la repr´esentation quantitative de la connaissance.

1.5.1.2 Phase d’utilisation

L’utilisation d’un r´eseau bay´esien est le calcul de la probabilit´e d’une hypoth`ese connaissant certaines observations. Il n’y a pas vraiment d’entr´ees ni de sorties dans un r´eseau bay´esien au sens o`u il peut tr`es bien servir `a d´eterminer la valeur la plus probable d’un noeud en fonction

d’informations donn´ees (pr´evoir, au sens entr´ees vers sorties), mais ´egalement pour connaitre la cause la plus probable d’une observation (expliquer, au sens sorties vers entr´ees).

L’utilisation repose sur la propagation de l’information au sein du r´eseau (des calculs de probabilit´es), appel´ee l’inf´erence.

Une fois le r´eseau construit et les observations sur une variable recueillies, quelles sont les r´epercutions sur les autres variables, comment les informations sont-elles mises `a jour ?

Le principe g´en´eral d’apprentissage peut ˆetre d´ecrit par la r`egle g´en´erale sui- vante [Na¨ım et al., 2007] :

a posteriori ≈ vraisemblance × a priori (1.69)

La modification de l’information dans le r´eseau par de nouvelles observations est ainsi condi- tionn´ee : la connaissance a priori est transform´ee a posteriori en fonction de la vraisemblance de l’observation des ´etudes selon la connaissance initiale. Cela se traduit encore par le fait que plus les exemples observ´es s’´eloignent de la connaissance initiale du r´eseau, plus il faut modifier celle-ci. D’un point de vue math´ematique, cette r`egle, appliqu´ee ici `a la connaissance, se traduit par le th´eor`eme de Bayes sur les lois de probabilit´e [Fienberg, 2005] :

P (Ai|B) =

P (B|Ai)P (Ai)

P

jP (B|Aj)P (Aj)

(1.70)

Le terme P (Ai) est la probabilit´e a priori de Ai ou encore appel´ee probabilit´e marginale de

A. Elle est ant´erieure `a toute information sur B. Le terme P (Ai|B) est appel´e la probabilit´e a

posteriori de Ai sachant B. Elle est post´erieure, au sens o`u elle d´epend directement de l’obser-

vation sur B. Le terme P (B|Ai), pour un B observ´e, est appel´e la fonction de vraisemblance de

Ai.

L’utilisation des r´eseaux bay´esiens au travers d’un exemple sera mis en ´evidence dans la partie suivante.

1.5.1.3 Remarques sur les r´eseaux bay´esiens

Les r´eseaux bay´esiens ne sont pas les seuls outils statistiques permettant la mise en forme de la connaissance : ils peuvent ˆetre utilis´es tout comme celle d’autres mod`eles comme les r´eseaux de neurones, les arbres de d´ecisions, l’analyse de donn´ees ou les syst`emes experts.

Tout d’abord, par rapport aux syst`emes d´eterministes comme les syst`emes experts, les r´eseaux bay´esiens permettent une prise en compte de l’incertitude dans le raisonnement. Ils sont donc adapt´es aux probl`emes pour lesquels l’incertitude est pr´esente, soit dans les observa- tions, soit dans les r`egles de d´ecision.

De plus, en termes d’utilisation du mod`ele, l’avantage essentiel est de permettre un forma- lisme complet de la connaissance sur un sujet sous forme de graphe causal contrairement aux techniques d’analyse de donn´ees. En cons´equence, la repr´esentation graphique explicite, intuitive et compr´ehensible permet l’utilisation par un non sp´ecialiste du domaine d’´etude.

Enfin, la place de l’expert marque la diff´erence avec les r´eseaux de neurones ou les arbres de d´ecisions puisque le physicien peut associer des ´equations au mod`ele statistique ou encore accorder un degr´e de confiance aux observations en fonction de son avis (probabilit´es subjectives). Les r´eseaux bay´esiens, pour l’´etude probabilis´ee du b´eton en environnement marin, paraissent donc ˆetre les outils les plus adapt´es pour l’actualisation des donn´ees. Ils vont permettre la gestion des variables al´eatoires dans un graphe causal utilisable par d’autres chercheurs non initi´es au traitement statistique. La construction du r´eseau pourra faire place aux connaissances maintenant nombreuses du domaine pour int´egrer la physico-chimie sous forme de relations d´eterministes par exemple. De plus, les diff´erents experts pourront intervenir comme garde-fou dans l’analyse des r´esultats en leur associant un degr´e de confiance.