Inférence approchée

Partie I Un formalisme graphique 11

_X_t₊₁_→_X_t

_X_t₊₂_→_X_t₊₁₍_j₎

_X_t_→_X_t₊₁

_X_t_→_X_t+1

_X_t₋₁_→_X_t

_X_t_→_X_t+1

_X_t₊₁_→_X_t

_X_t_→_X_t+1

^π_q₍⁽_x^xiⁱ)⁾

Partie I Un formalisme graphique 11

2.2 Algorithmes d’inférence

2.2.5 Inférence approchée

2.3 Conclusion . . . . 53

Il est souvent difficile d’interpréter l’état d’un patient en se basant uniquement sur une

pho-tographie de ses derniers résultats. Qu’il s’agisse d’intégrer l’évolution d’un paramètre, d’être

capable de faire la différence entre une mesure localement haute et une mesure haute résultant

d’une réelle évolution d’un paramètre ou bien encore de pouvoir prédire l’évolution de l’état du

patient, le raisonnement médical se fonde sur une connaissance de la dynamique du système que

constitue le corps humain, même si celle-ci n’est pas nécessairement formalisée

mathématique-ment.

Nous nous intéressons dans ce chapitre à la modélisation stochastique de processus

dyna-miques en utilisant le formalisme des réseaux bayésiens dynadyna-miques (DBN) qui sont une

exten-sion des réseaux bayésiens permettant de travailler avec des processus stochastiques. Les modèles

markoviens comme les chaines de markov, les modèles de markov cachés (HMM), les filtres de

Kalman sont des exemples de modèles dynamiques représentables par un DBN.

Le formalisme des réseaux bayésiens dynamiques permet de donner des algorithmes génériques

capables de répondre aux problèmes de l’inférence et de l’apprentissage dans ces structures.

Z

Z

. . . Z

Z

Figure 2.1 – Représentation graphique d’une chaîne de Markov.

2.1 Processus dynamiques markoviens

Nous nous plaçons dans le cadre de la modélisation stochastique d’un système dynamique.

L’état du système est supposé décrit par un processus stochastiques Z

éventuellement

décom-posable en un ensemble de processus

Z

= (Z

, . . . , Z

)

où t∈N dans le cas d’un processus à temps discret.

2.1.1 Hypothèse markovienne

Un processus Z

est dit markovien s’il vérifie l’indépendance conditionnelle suivante :

Z

⊥ Z

| Z

pour tout k < t−1. (2.1)

Cela peut s’interpréter en disant que connaître la valeur Z

etZ

n’apporte pas d’information

supplémentaire pour prédire la valeur deZ

par rapport à connaître la valeur deZ

seulement.

Ceci se traduit, avec le vocabulaire utilisé dans le cadre des réseaux bayésiens, parZ

d-sépare

Z

etZ

.

Cette hypothèse d’indépendance conditionnelle, bien que correspondant souvent dans la

pra-tique à une approximation, est fondamentale dans le sens où elle permet de décrire le système à

l’aide de lois de probabilité locales et de résoudre le problème de l’inférence sans avoir besoin de

recourir à la loi jointe sur l’ensemble de la séquence. En termes de lois de probabilité, l’hypothèse

markovienne est caractérisée par l’équation 2.2 et représentée graphiquement par la figure 2.1

P(Z

| Z

, . . . ,Z

) =P(Z

| Z

) (2.2)

Cette forme de modélisation est le pendant stochastique de la représentation donnée dans le

cas déterministe d’un système dynamique d’ordre 1 par une application bijective φ:X→X de

l’espace des phases sur lui même. Pour un système dynamique déterministe à temps discret nous

avons :

x

=φ(x

) =. . .=φ

(x

) (2.3)

Ce qui dans le cas stochastique discret s’écrit, en notant A la matrice de transition définie par

A(i, j) =P(Z

=i| Z

=j)etb

le vecteur de probabilités donné parb

(i) =P(Z

=i):

P(Z

=i) = ^X

) = ^X

) = ^X