Les réseaux bayésiens dynamiques exploités pour la réalisation du module de fouille de

4.4. Mise en application

4.4.1 Module de fouille de données

4.4.1.5 Les réseaux bayésiens dynamiques exploités pour la réalisation du module de fouille de

Généralités :

Un RB est un graphe causal orienté et acyclique (DAG) permettant de représenter des

variables aléatoires avec leurs dépendances. Il présente la distribution des probabilités

conditionnelles d'un ensemble de variables. Ses nœuds représentent les variables aléatoires et

ses arcs représentent les dépendances entre ces variables [Jensen 96] [Lauritzen et al. 99].

La distribution de probabilité des variables aléatoires S = {X

1, …, XN

} dans un RB est calculé

par la multiplication des probabilités conditionnelles locales de tous les nœuds. Soit un nœud

Xi dans S dénotant la variable aléatoire Xi, et soit Pa(Xi) dénotant les nœuds parents de Xi,

alors, la distribution de probabilités de S = {X1, …, XN} est exprimée comme suit :

P(X

₁

, X

₂

, …, X

} = 



N i 1

p(X

| Pa(X

))

Les RB ne permettent pas de représenter les relations temporelles entre les variables

aléatoires. Pour cette raison, on utilise les RB Dynamiques (RBD) [Darwich 01] [Murphy 02].

Les RBD formalisent la distribution de probabilité d'un ensemble de variables temporelles

X[t] = {X1[t],…, XN[t]}. Si on considère T tranches de temps, le RBD peut être considéré

comme un RB statique avec T  N variables. En utilisant la propriété de factorisation des RB

[Darwich 01] [Murphy 02], la densité de probabilité de X

= {X[1],…, X[T]} peut être

exprimée comme suit :

P(X[1], …, X[N]} = 

 T t 1



 N i 1

p(X

[t] | Pa(X

[t])) avec Pa(Xi[t]) dénotent les parents de Xi[t]

En raison de leur capacité à représenter les connaissances incertaines, les réseaux bayésiens

(RB) jouent un rôle de plus en plus important dans beaucoup d'applications médicales. Ils ont

été proposés dans les années 80 comme formalisme de représentation et de raisonnement pour

des problèmes impliquant l'incertitude ; ils adoptent pour cela la théorie des probabilités.

L’exploitation de ce formalisme dans le contexte de la prise de décision médicale a

commencé à la fin des années 80 [Pearl 88].

La littérature médicale contient des exemples d'utilisation des RB. On peut citer un modèle de

RB développé et mis à la disposition de cliniciens pour l’aide au traitement des pneumonies

en soins intensifs [Lucas et al. 00]. De leur part, Burnside et ses collègues [Burnside et al. 06]

ont proposé l'utilisation des RB pour la prédiction du risque de cancer du sein.

L’application des RBD pour la lutte contre les IN : la structure d’un RBD est obtenue par

un algorithme itératif et récursif d’apprentissage dynamique. Les variables fixes et

temporelles utilisées sont listées dans le tableau 4.5.

Tableau 4.5 : variables pour l’application du RBD

Variables fixes Variables temporelles

Acronyme Description Acronyme description

Sex Le sexe du patient dsj La durée du séjour

age1 L’âge du patient act_i Acte effectué le jour i

Periode_entr Indique la saison d’entrée en réanimation cissuei Issue pour le jour i

Orig Le service d’origine examinfi Examen infectieux effectué le jour i

Detorig Détails sur le service d’origine sens_i Sensibilité du germe (de l’infection acquise le jour i) à l’antibiotique prescrit

priseAnti Prise d’antibiotique resulti Probabilité de prédiction dynamique d’IN

pour le jour i

Knaus La catégorisation Apache

Cissue patient décédé ou ayant survécu

Diag Diagnostic

Ant Antécédent

Result Probabilité de prédiction statique d’IN

La théorie des RB permet de représenter des rapports probabilistes entre les variables

observées ce qui est bien adapté à l'incertitude inhérente aux questions médicales.

Construction des modèles de connaissances sur des données fixes (RB statique) : les

dépendances causales entre les variables fixes sont représentées par la figure 4.3. Cependant

les observations faites sur le RB statique ne sont pas suffisantes pour estimer la probabilité

quotidienne d'occurrence d’IN.

age 1 Periode_entr

detorig _priseAnti_{act 1}

cat knaus

orig sex

cissue act 1diag1 diag2 ant1

result

Le modèle extrait pourrait détecter des relations entre les variables logiques comme la relation

entre l'âge et l'antécédent, entre l'âge et l’issue. Toutefois le graphe causal obtenu, contient des

liens "illogiques" entre les nœuds (par exemple, l'âge agit sur la prise d’antibiotique). On peut

également noter l’absence de liens présentant des relations intéressantes (par exemple, la

relation entre le résultat et l’issue).

Les probabilités sont calculées en utilisant P(V

|C) avec :

 V

:le nœud (sexe, age1, periode_entr… diag1) ayant des valeurs discrètes, et

 C :la classe à prévoir (issue et résultat) ayant les valeurs booléennes.

L'utilisation des probabilités et du graphe causal fournit des modèles de connaissances qui ne

donnent une grande valeur à ajouter. Afin de représenter l'influence des événements passés

sur l'état actuel du patient, il est nécessaire de prolonger ce modèle avec un RB dynamique.

Construction des modèles de connaissances sur des données temporelles (RB

dynamique) : la figure 4.4 montre un modèle dynamique basé sur des variables temporelles.

Le graphe causal représente l'interdépendance entre les variables temporelles pour une tranche

de temps T. Nous avons employé pour cette structure dynamique les valeurs de chaque série

de temps (act

… act

, exinf

… exinf

) connectées directement à deux nœuds prédictifs qui

sont le résultat et l'issue.

result n cissue n

dsj ^{act 1} act 2 act 10

examinf 1 _{examinf 2} examinf 30

…

Figure 4.4 : dépendances causales dans un RB dynamique (modèle dynamique extrait)

Le principe de notre RBD peut être défini par :

- À t=0, on utilise le modèle statique extrait (cf. figure 4.3).

- Pour 1 t T (durée d'hospitalisation) ; il s’agit de "dérouler" le modèle dynamique

pour chaque jour de la durée d’hospitalisation.

Admission du patient t0 Jour 1 t₁ Jour n T Temps P0=x0% _P1=P(result 1/x₀, mesures) = x1% Pn=P(result_n/x_n-1, mesures) = xn% result 1 cissue 1

dsj act 1 act 2 act 10

examinf 1 examinf 2 examinf 30

…..

result n cissue n

dsj ^{act 1} act 2 act 10

examinf 1 examinf 2 examinf 30

….. ….. … age 1 Periode_entr detori g priseAnti cat knaus orig sex cissue _act 1

diag1 diag2 ant1 result

Figure 4.5 :graphe causal du RBD

Le résultat de distribution des probabilités est donné par :

Avec :

 T : la durée de temps d'hospitalisation,

 N : le nombre de variables pour chaque modèle extrait.

L'application des RBD pour la lutte contre les IN donne des bons résultats de prédiction qui

seront présentés dans le chapitre suivant.

Dans le document Démarche centrée utilisateur pour la conception de SIAD basés sur un processus d'Extraction de Connaissances à partir de Données, Application à la lutte contre les infections nosocomiales (Page 134-138)