• Aucun résultat trouvé

Jusqu’ici, nous n’avons consid´er´e que le cas o`u la contrainte ´etudi´ee est satisfiable.

Lorsque ce n’est pas le cas, on aimerait pouvoir circonscrire des raisons possibles pour

ce probl`eme. Si un graphe n’est pas compatible avec des observations, ce peut ˆetre pour

trois raisons :

– signe erron´e

– fl`eche manquante

– ´equation non applicable (voir la discussion sur les hypoth`eses dans le cadre

diff´erentiel au chapitre pr´ec´edent).

Nous proposons une formulation g´en´erale pour d´efinir ce type de probl`eme et ce

que nous appellerons undiagnostic.

D´efinition 9. Soit C une contrainte et σ une substitution, telles que C[σ] n’admet

aucune solution. On appelle correction une substitutionσ

0

de mˆeme domaine, telle que

C[σ

0

] admette une solution.

La distance entre deux mesures σ et σ

0

de mˆeme domaine est le nombre de leurs

diff´erences. Plus pr´ecis´ement,

d(σ, σ

0

) =|{x∈dom(σ)|σ(x)6=σ

0

(x)}|

Une correction est un diagnostic si d(σ, σ

0

) est minimale.

La fonction que nous venons de d´efinir est bien une distance : comme les fonctions

ont mˆeme domaine, il s’agit de la distance de Hamming. Voyons tout de suite comment

cette d´efinition se sp´ecialise en diff´erents probl`emes pratiques.

4.4.1 Donn´ees bruit´ees

Les donn´ees de puces `a ADN fournissent le rapport des concentrations/niveau

d’ex-pression entre deux conditions exp´erimentales. Quand le rapport est significativement

diff´erent de 1, l’interpr´etation en un signe de variation est relativement sˆure. N´eanmoins

pour la plupart des g`enes, la variation n’est pas significative, et peut mener `a une

in-terpr´etation incorrecte : un ratio l´eg`erement sup´erieur `a 1 doit-il ˆetre entr´e dans le

mod`ele comme une variation positive, ou nulle, ou carr´ement rejet´ee ? On peut

envisa-ger deux strat´egies :

– soit rejeter toutes les ratios en-dessous d’un certain seuil, au risque de perdre de

l’information,

– soit garder toutes les donn´ees, quitte `a obtenir une contrainte qualitative sans

solution.

La deuxi`eme alternative requiert de disposer d’un outil permettant d’identifier les

donn´ees peu fiables. Voici une fa¸con de proc´eder :

– construire la contrainte de consistance aux sommets C

G

– construire la mesure µ

θ

correspondant aux donn´ees exp´erimentales, avec

l’in-terpr´etation suivante :

ratio pour x µ(x)

r <−θ → –

−θ < r < θ → 0

θ < r → +

– dans le cas o`uC[µ

θ

] n’est pas satisfiable, d´eterminer l’ensemble des diagnostics

– chercherdans l’ensemble des diagnosticsles invariants, ou calculer les marginales.

4.4.2 Reconstruction de r´eseau

Une probl´ematique r´ecurrente en biologie mol´eculaire consiste `a d´eterminer les

inter-actions mol´eculaires dans un syst`eme biologique donn´e, `a partir de donn´ees de

pertur-bation. La quantit´e de donn´ees disponible est en g´en´eral tr`es insuffisante pour suffire

`

c’est-`a-dire qu’il admet un grand nombre de solutions. On impose donc en g´en´eral un

crit`ere de parcimonie, qui limite le nombre de solutions. Ce genre de tˆache entre tout

`

a fait dans notre probl´ematique :

– on consid`ere un graphe d’interactionG complet, dont les arcs sont ´etiquet´es avec

un signe, ´eventuellement nul. Ainsi, les ´equations qualitatives sont de la forme :

X

ik

X

j∈G

S

ji

X

jk

– on consid`ere la mesure µ o`u les donn´ees exp´erimentales sont int´egr´ees comme

au-dessus, et o`u l’on ajoute µ(S

ji) =

0.

– le probl`eme de reconstruction consiste alors `a trouver l’ensemble des µ

0

qui sont

des diagnostics deµ, et `a y chercher des invariants ou calculer les marginales

4.4.3 Recherche des sous-syst`emes incompatibles

Une contrainte C est une conjonction de contraintes plus simples, not´eesC

ik

.

Cha-cune de ces contraintesC

ik

est associ´ee `a un sommetiet une mesurek. Pour faciliter la

lecture et la compr´ehension des inconsistances d´etect´ees, une possibilit´e consiste `a

iso-ler les contraintes qui en sont `a l’origine ; et si possible d’en isoler le plus petit nombre

possible. L`a encore notre formulation permet d’aborder ce probl`eme :

– `a chaque contrainte C

ik, on associe une variable bool´

eenne B

ik, et on consid`

ere

les contraintes :

C

0ik

=B

ik

∨C

ik

k

]

et leur conjonction :

C

0

=^

i,k

C

0ik

– on se donne la mesureµ telle que µ(B

ik

) =F

– si C[µ] n’est pas satisfiable alors on calcule les diagnosticsµ

0

4.4.4 Calcul des diagnostics

Nous montrons `a pr´esent comment calculertousles diagnostics d’une contrainte non

consistante avec une mesure (voir la fonction diagnostic). Comme dans les sections

pr´ec´edentes, il s’agit d’un calcul r´ecursif sur le diagramme repr´esentant la contrainte.

La difficult´e ici repose sur le stockage des diagnostics trouv´es, qui peuvent en effet

ˆetre tr`es nombreux. L’astuce consiste `a stocker l’ensemble des diagnostics comme un

diagramme de d´ecision. La valeur calcul´ee par la fonction diagnostic est une paire,

comportant la distance de la mesure `a ses diagnostics et l’ensemble des diagnostics,

lui-mˆeme repr´esent´e par un diagramme.

Pour all´eger la pr´esentation, nous avons introduit une fonction lin qui est un

constructeur de diagramme analogue `anode, et qui re¸coit trois arguments : une variable

x, un diagramme D et un signes. La fonction lin construit le diagramme avecx `a la

racine, avecD pour le fils correspondant au signe s, et leaf(F) pour l’autre fils.

Function diagnostic(d: diagram, µ : substitution)

Output: une paire (δ,C) o`uC repr´esente l’ensemble des diagnostics de d[µ]

if d=leaf(F)then return (∞, d)

if dom(µ) =∅ then return(0,leaf(T))

x←min dom(µ) // minimum selon ≺

if d=leaf(T) then

(δ, m)←diagnostic(d, µ

/dom(µ)\{x}

)

return(0,lin(x, m, µ(x)))

if root(d)≺xthen

+

, m

+

)←diagnostic(dthen(d), µ)

, m

)←diagnostic(delse(d), µ)

δ←min {δ

+

, δ

}

return(δ,W

s∈{+,–},δs

lin(root(d), m

s

, s))

if root(d)xthen

(δ, m)←diagnostic(d,dthen(µ))

returnlin(x, m, µ(X))

if root(d) =xthen

+

, m

+

)←diagnostic(dthen(d), µ

/dom(µ)\{x}

)

, m

)←diagnostic(delse(d), µ

/dom(µ)\{x}

)

if µ(x) =+ thenδ

←δ

+ 1elseδ

+

←δ

+

+ 1

δ←min {δ

+

, δ

}

return(δ,W

Une limite importante de cet algorithme est qu’il requiert la construction de la

contrainte (c’est-`a-dire la conjonction compl`ete). Or celle-ci peut contenir un grand

nombre de variables et ne pas tenir en m´emoire centrale. C’est un s´erieux handicap

pour la reconstruction de graphe d’interaction : le nombre de variables de la contrainte

croˆıt ´evidemment en O(n

2

) sinest le nombre de g`enes.