Jusqu’ici, nous n’avons consid´er´e que le cas o`u la contrainte ´etudi´ee est satisfiable.
Lorsque ce n’est pas le cas, on aimerait pouvoir circonscrire des raisons possibles pour
ce probl`eme. Si un graphe n’est pas compatible avec des observations, ce peut ˆetre pour
trois raisons :
– signe erron´e
– fl`eche manquante
– ´equation non applicable (voir la discussion sur les hypoth`eses dans le cadre
diff´erentiel au chapitre pr´ec´edent).
Nous proposons une formulation g´en´erale pour d´efinir ce type de probl`eme et ce
que nous appellerons undiagnostic.
D´efinition 9. Soit C une contrainte et σ une substitution, telles que C[σ] n’admet
aucune solution. On appelle correction une substitutionσ
0de mˆeme domaine, telle que
C[σ
0] admette une solution.
La distance entre deux mesures σ et σ
0de mˆeme domaine est le nombre de leurs
diff´erences. Plus pr´ecis´ement,
d(σ, σ
0) =|{x∈dom(σ)|σ(x)6=σ
0(x)}|
Une correction est un diagnostic si d(σ, σ
0) est minimale.
La fonction que nous venons de d´efinir est bien une distance : comme les fonctions
ont mˆeme domaine, il s’agit de la distance de Hamming. Voyons tout de suite comment
cette d´efinition se sp´ecialise en diff´erents probl`emes pratiques.
4.4.1 Donn´ees bruit´ees
Les donn´ees de puces `a ADN fournissent le rapport des concentrations/niveau
d’ex-pression entre deux conditions exp´erimentales. Quand le rapport est significativement
diff´erent de 1, l’interpr´etation en un signe de variation est relativement sˆure. N´eanmoins
pour la plupart des g`enes, la variation n’est pas significative, et peut mener `a une
in-terpr´etation incorrecte : un ratio l´eg`erement sup´erieur `a 1 doit-il ˆetre entr´e dans le
mod`ele comme une variation positive, ou nulle, ou carr´ement rejet´ee ? On peut
envisa-ger deux strat´egies :
– soit rejeter toutes les ratios en-dessous d’un certain seuil, au risque de perdre de
l’information,
– soit garder toutes les donn´ees, quitte `a obtenir une contrainte qualitative sans
solution.
La deuxi`eme alternative requiert de disposer d’un outil permettant d’identifier les
donn´ees peu fiables. Voici une fa¸con de proc´eder :
– construire la contrainte de consistance aux sommets C
∅G– construire la mesure µ
θcorrespondant aux donn´ees exp´erimentales, avec
l’in-terpr´etation suivante :
ratio pour x µ(x)
r <−θ → –
−θ < r < θ → 0
θ < r → +
– dans le cas o`uC[µ
θ] n’est pas satisfiable, d´eterminer l’ensemble des diagnostics
– chercherdans l’ensemble des diagnosticsles invariants, ou calculer les marginales.
4.4.2 Reconstruction de r´eseau
Une probl´ematique r´ecurrente en biologie mol´eculaire consiste `a d´eterminer les
inter-actions mol´eculaires dans un syst`eme biologique donn´e, `a partir de donn´ees de
pertur-bation. La quantit´e de donn´ees disponible est en g´en´eral tr`es insuffisante pour suffire
`
c’est-`a-dire qu’il admet un grand nombre de solutions. On impose donc en g´en´eral un
crit`ere de parcimonie, qui limite le nombre de solutions. Ce genre de tˆache entre tout
`
a fait dans notre probl´ematique :
– on consid`ere un graphe d’interactionG complet, dont les arcs sont ´etiquet´es avec
un signe, ´eventuellement nul. Ainsi, les ´equations qualitatives sont de la forme :
X
ik≈X
j∈G