• Aucun résultat trouvé

Tout mod`ele est bas´e sur des donn´ees, elles sont le fondement d’une approche de

mod´elisation. Ce sont elles qui conditionnent les limites de la mod´elisation, celles sur quoi

repose souvent la r´eussite d’une ´etude. Les donn´ees se distinguent d’une part par leur type,

et d’autre part par leur moyen d’acquisition.

Certains formalismes utilisent des donn´ees quantitatives (mod`eles diff´erentiels, rule

based, etc.) telles que des concentrations et des constantes cin´etiques. D’autres

forma-lismes utilis´es dans les mod`eles Bool´een et les r´eseaux de Petri se basent sur des donn´ees

qualitatives.

La majorit´e des approches de mod´elisation actuelles autour de la signalisation sont

bas´ees sur une acquisition manuelle des donn´ees. En effet, la litt´erature demeure la source

la plus utilis´ee pour concevoir un mod`ele. Ceci s’explique de plusieurs fa¸con : l’acquisition

manuelle permet une meilleur curation et donc un contrˆole plus strict de la qualit´e des

donn´ees. Une meilleure interpr´etation des r´esultats est aussi obtenue.

En contrepartie, cette acquisition demande ´enorm´ement de temps, en comparaison

avec une acquisition automatique puisque qu’elle d´epend de ressources humaines. En effet,

certains mod`eles sont bas´es sur pr`es d’un millier de publications, faisant de l’interpr´etation

de r´esultats vers la conception de mod`ele une activit´e des plus chronophage [55]. En lien

avec ce recueil de donn´ees `a partir de la litt´erature, la d´efinition des limites du mod`ele

constitue une difficult´e importante. Les mod`eles cr´e´es par l’interpr´etation manuelle de la

litt´erature sont g´en´eralement con¸cus autour d’une voie de signalisation ou d’une question

sp´ecifique. Dans ce contexte il faut d´efinir les limites d’un mod`ele, c’est `a dire quels

sont ses composants et ses r´eactions. La d´ecision d’ajouter ou non une r´eaction dans

une voie de signalisation est un crit`ere hautement ”auteur sp´ecifique” [72] et conduit

`

a des mod`eles diff´erents pour un mˆeme processus biologique. De plus l’homog´en´eit´e de

l’interpr´etation n’est pas garantie, `a l’inverse d’une acquisition automatique o`u plusieurs

r´eactions du mˆeme type (phosphorylation, translocation) seront trait´ees avec le mˆeme

pattern d´efini au pr´ealable par le mod´elisateur. Dans le mˆeme esprit, tout mod´elisateur

s’est d´ej`a demand´e si la connaissance dirigeait la conception des mod`eles. Ce qui signifie

qu’en connaissant `a la fois les donn´ees et la question pos´ee, il est possible, de fa¸con tout `a

fait involontaire de concevoir un mod`ele sp´ecifique dont l’interpr´etation sera orient´ee vers

la r´eponse. L’interpr´etation demeure un processus subjectif et il est ´evident que diff´erentes

personnes, avec les mˆeme donn´ees et le mˆeme formalisme, peuvent concevoir des mod`eles

diff´erents suivant leur connaissance de la question pos´ee.

Pour ´eliminer ces potentiels d´efauts dus `a une interpr´etation manuelle, il est possible

de concevoir un mod`ele de fa¸con automatique, `a partir d’une base de donn´ees dont le

re-cueil des connaissances aura ´et´e effectu´e sans a priori par rapport au mod`ele `a construire.

Pour que la conception automatique de mod`ele soit efficace, la base de donn´ees doit

conte-nir suffisamment de donn´ees dont la qualit´e doit ˆetre v´erifi´ee afin de permettre une

in-terpr´etation identique et non ambigue du contenu da la base. Cette difficult´e est ´evoqu´ee

dans les travaux de Heiner et al [52] o`u plusieurs interpr´etations de la repr´esentation de

la base de donn´ee KEGG sont pr´esent´ees(Figure 2.10). Sans connaissance sur les donn´ees,

la repr´esentation adopt´ee par KEGG ne permet pas de trancher entre une activation de

CASP2 et CASP3 par CASP8, ou une r´eaction consommant CASP8 pour produire CASP2

et CASP3. Cette exemple souligne l’ambigu¨ıt´e de cette repr´esentation et la n´ecessit´e de

travailler avec des donn´ees clairement d´efinies.

L’int´erˆet de la d´emarche automatique r´eside dans le fait que les donn´ees n’ont pas ´et´e

structur´ees dans le but de concevoir un mod`ele et n’oriente pas la construction du mod`ele

dans le sens de la r´eponse `a une question. L’interpr´etation automatique permet de prendre

en compte toute l’information sans a priori, et de g´en´erer des mod`eles plus homog`enes et

formalis´es.

Fig. 2.10: Interpr´etations multiples de sch´ema KEGG en r´eseau de Petri d’apr`es [52].

(A) L’activation de CASP2 et CASP3 par CASP8 symbolis´ee par des fl`eches peut ˆetre

interpr´et´ee de diff´erentes fa¸cons. CASP8 permet l’activation de CASP2 ou CASP3 de fa¸con

exclusive (cas 1), ou permettre l’action de CASP2 et CASP3 `a diff´erents moments (cas 2).

Enfin l’activation peut ˆetre simultan´ee (cas 3). (B) Les activations de CASP3 par CASP8

et CASP9 peuvent etre consid´er´ees comme ind´ependantes (cas 1) ou conjointes (cas 2).

Si elles sont ind´ependantes, la pr´esence de CASP8 ou CASP9 suffit `a activer CASP3. Si

elles sont conjointes, la pr´esence de CASP8 et CASP9 est n´ecessaire pour activer CASP3.

Actuellement la notation graphique utilis´ee par la base de donn´ee KEGG ne permet pas

de choisir entre les diff´erents cas.