4.4. Mise en application
4.4.1 Module de fouille de données
4.4.1.5 Les réseaux bayésiens dynamiques exploités pour la réalisation du module de fouille de
Généralités :
Un RB est un graphe causal orienté et acyclique (DAG) permettant de représenter des
variables aléatoires avec leurs dépendances. Il présente la distribution des probabilités
conditionnelles d'un ensemble de variables. Ses nœuds représentent les variables aléatoires et
ses arcs représentent les dépendances entre ces variables [Jensen 96] [Lauritzen et al. 99].
La distribution de probabilité des variables aléatoires S = {X
1, …, XN} dans un RB est calculé
par la multiplication des probabilités conditionnelles locales de tous les nœuds. Soit un nœud
Xi dans S dénotant la variable aléatoire Xi, et soit Pa(Xi) dénotant les nœuds parents de Xi,
alors, la distribution de probabilités de S = {X1, …, XN} est exprimée comme suit :
P(X
1, X
2, …, X
N} =
N i 1
p(X
i| Pa(X
i))
Les RB ne permettent pas de représenter les relations temporelles entre les variables
aléatoires. Pour cette raison, on utilise les RB Dynamiques (RBD) [Darwich 01] [Murphy 02].
Les RBD formalisent la distribution de probabilité d'un ensemble de variables temporelles
X[t] = {X1[t],…, XN[t]}. Si on considère T tranches de temps, le RBD peut être considéré
comme un RB statique avec T N variables. En utilisant la propriété de factorisation des RB
[Darwich 01] [Murphy 02], la densité de probabilité de X
T= {X[1],…, X[T]} peut être
exprimée comme suit :
P(X[1], …, X[N]} =
T t 1
N i 1p(X
i[t] | Pa(X
i[t])) avec Pa(Xi[t]) dénotent les parents de Xi[t]
En raison de leur capacité à représenter les connaissances incertaines, les réseaux bayésiens
(RB) jouent un rôle de plus en plus important dans beaucoup d'applications médicales. Ils ont
été proposés dans les années 80 comme formalisme de représentation et de raisonnement pour
des problèmes impliquant l'incertitude ; ils adoptent pour cela la théorie des probabilités.
L’exploitation de ce formalisme dans le contexte de la prise de décision médicale a
commencé à la fin des années 80 [Pearl 88].
La littérature médicale contient des exemples d'utilisation des RB. On peut citer un modèle de
RB développé et mis à la disposition de cliniciens pour l’aide au traitement des pneumonies
en soins intensifs [Lucas et al. 00]. De leur part, Burnside et ses collègues [Burnside et al. 06]
ont proposé l'utilisation des RB pour la prédiction du risque de cancer du sein.
L’application des RBD pour la lutte contre les IN : la structure d’un RBD est obtenue par
un algorithme itératif et récursif d’apprentissage dynamique. Les variables fixes et
temporelles utilisées sont listées dans le tableau 4.5.
Tableau 4.5 : variables pour l’application du RBD
Variables fixes Variables temporelles
Acronyme Description Acronyme description
Sex Le sexe du patient dsj La durée du séjour
age1 L’âge du patient acti Acte effectué le jour i
Periode_entr Indique la saison d’entrée en réanimation cissuei Issue pour le jour i
Orig Le service d’origine examinfi Examen infectieux effectué le jour i
Detorig Détails sur le service d’origine sensi Sensibilité du germe (de l’infection acquise le jour i) à l’antibiotique prescrit
priseAnti Prise d’antibiotique resulti Probabilité de prédiction dynamique d’IN
pour le jour i
Knaus La catégorisation Apache
Cissue patient décédé ou ayant survécu
Diag Diagnostic
Ant Antécédent
Result Probabilité de prédiction statique d’IN
La théorie des RB permet de représenter des rapports probabilistes entre les variables
observées ce qui est bien adapté à l'incertitude inhérente aux questions médicales.
Construction des modèles de connaissances sur des données fixes (RB statique) : les
dépendances causales entre les variables fixes sont représentées par la figure 4.3. Cependant
les observations faites sur le RB statique ne sont pas suffisantes pour estimer la probabilité
quotidienne d'occurrence d’IN.
age 1 Periode_entr
detorig priseAntiact 1
cat knaus
orig sex
cissue act 1diag1 diag2 ant1
result
Le modèle extrait pourrait détecter des relations entre les variables logiques comme la relation
entre l'âge et l'antécédent, entre l'âge et l’issue. Toutefois le graphe causal obtenu, contient des
liens "illogiques" entre les nœuds (par exemple, l'âge agit sur la prise d’antibiotique). On peut
également noter l’absence de liens présentant des relations intéressantes (par exemple, la
relation entre le résultat et l’issue).
Les probabilités sont calculées en utilisant P(V
i|C) avec :
V
i:le nœud (sexe, age1, periode_entr… diag1) ayant des valeurs discrètes, et
C :la classe à prévoir (issue et résultat) ayant les valeurs booléennes.
L'utilisation des probabilités et du graphe causal fournit des modèles de connaissances qui ne
donnent une grande valeur à ajouter. Afin de représenter l'influence des événements passés
sur l'état actuel du patient, il est nécessaire de prolonger ce modèle avec un RB dynamique.
Construction des modèles de connaissances sur des données temporelles (RB
dynamique) : la figure 4.4 montre un modèle dynamique basé sur des variables temporelles.
Le graphe causal représente l'interdépendance entre les variables temporelles pour une tranche
de temps T. Nous avons employé pour cette structure dynamique les valeurs de chaque série
de temps (act
1… act
10, exinf
1… exinf
30) connectées directement à deux nœuds prédictifs qui
sont le résultat et l'issue.
result n cissue n
dsj act 1 act 2 act 10
examinf 1 examinf 2 examinf 30
…
…
Figure 4.4 : dépendances causales dans un RB dynamique (modèle dynamique extrait)
Le principe de notre RBD peut être défini par :
- À t=0, on utilise le modèle statique extrait (cf. figure 4.3).
- Pour 1 t T (durée d'hospitalisation) ; il s’agit de "dérouler" le modèle dynamique
pour chaque jour de la durée d’hospitalisation.
Admission du patient t0 Jour 1 t1 Jour n T Temps P0=x0% P1=P(result 1/x0, mesures) = x1% Pn=P(resultn/xn-1, mesures) = xn% result 1 cissue 1
dsj act 1 act 2 act 10
examinf 1 examinf 2 examinf 30
…..
…..
result n cissue n
dsj act 1 act 2 act 10
examinf 1 examinf 2 examinf 30
….. ….. … age 1 Periode_entr detori g priseAnti cat knaus orig sex cissue act 1
diag1 diag2 ant1 result