• Aucun résultat trouvé

Ce chapitre traite de la prise en compte de la complexit´e du vivant dans les applications informatiques. Il est temps de faire une pause `a mi-parcours de cet ´etat de l’art pour en intro-duire plus clairement la suite. `A la lecture du d´ebut de cette th`ese, nous avons pu constater que la biologie utilise diff´erents moyens d’´etudes pour faire ´evoluer l’´etat des connaissances sur le vivant. Cette section r´esume ces m´ethodes et nous focalise sur l’une d’elle : la simulation, qui nous int´eresse plus particuli`erement.

2.3.1 L’exp´erimentation in vivo

La biologie est en premier lieu, une science exp´erimentale (voir section 1.1). L’exp´erimen-tation in vivo est la m´ethode de base en biologie. Elle est n´ecessaire `a toute mod´elisation, toute hypoth`ese sur le vivant. Aujourd’hui encore, la validation d’un nouveau traitement m´edical doit obligatoirement passer par des tests in vivo.

L’objet de ce type d’exp´erience, c’est l’organisme. En effet un organisme est vu comme une instance particuli`ere de l’esp`ece `a laquelle il appartient. Il mod´elise ainsi cette esp`ece de la mani`ere la plus fiable que l’on puisse consid´erer. Ainsi une batterie de tests sur un ensemble de patients suffisamment repr´esentatif permet de valider une hypoth`ese sur une pathologie. Parfois une esp`ece peut ˆetre ´egalement consid´er´ee comme un mod`ele approch´e d’une autre esp`ece. Les exp´eriences in vivo sont par exemple pratiqu´ees sur les souris pour faire avancer les connaissances sur des pathologies humaines. Nous reviendrons sur la notion d’exp´erience dans le chapitre suivant (voir section 3.1.2).

L’av`enement de la simulation num´erique

2.3.2 L’exp´erimentation in vitro

Les exp´eriences in vivo peuvent dans certaines situations poser des probl`emes techniques ou ´ethiques. Le biologiste doit alors trouver des m´ethodes alternatives pour contourner les contraintes qui s’imposent `a lui. Dans ce cas, le mod`ele devient une repr´esentation artifi-cielle du ph´enom`ene ou de l’objet ´etudi´e. Les m´ethodes alternatives consistent `a tester le comportement de cette repr´esentation sous l’effet d’actions que l’on peut exercer sur elle. C’est le cas des exp´eriences in vitro dans lesquelles on ´etudie un ´echantillon ou une maquette physique construite par analogie avec le syst`eme r´eel. L’apport technique des physiciens et des chimistes `a l’´epoque de l’´emergence de la biologie mol´eculaire a ´et´e consid´erable dans ce domaine (voir sections 1.2 et 1.3). Cependant, l’explosion des donn´ees provoqu´ee par les avanc´ees de l’exp´erimentation conduit d´esormais, `a mettre l’accent sur d’autres m´ethodes plus th´eoriques pour interpr´eter les r´esultats des exp´eriences.

2.3.3 Le raisonnement in abstracto

Les exp´eriences in vivo et in vitro permettent de construire des mod`eles th´eoriques des syst`emes ou ph´enom`enes ´etudi´es, en interpr´etant les donn´ees obtenues. Il faut ensuite ´etudier ces mod`eles th´eoriques pour formuler de nouvelles hypoth`eses, ou pour pr´eciser et produire de nouvelles connaissances.

De plus, l’observation d’un syst`eme r´eel, d’un ´echantillon ou d’une maquette physique peut, dans certains cas, interf´erer avec le ph´enom`ene ´etudi´e. En outre, mˆeme in vitro, les moyens technologiques sont souvent trop limit´es pour permettre l’observation d´etaill´ee du ph´enom`ene. Dans ce cas, on a recours `a la th´eorie qui permet de raisonner sur des mod`eles abstraits.

Nous pouvons appeler raisonnement in abstracto, le raisonnement sur un mod`ele th´eorique formel. C’est ce que nous avons pr´esent´e dans les sections pr´ec´edentes (voir sections 2.1 et 2.2). Les m´ethodes de raisonnement math´ematiques ou logiques permettent de d´emontrer certaines propri´et´es de mod`eles th´eoriques. Chaque m´ethode vise plus ou moins `a d´efinir une th´eorie permettant le raisonnement dans le monde des id´ees, r´epondant ainsi aux questions pos´ees par le changement de paradigme en biologie (section 1.5).

2.3.4 Les calculs in silico

Nous avons pu remarquer dans les sections 2.1 et 2.2 que les th´eories permettant le raison-nement in abstracto font souvent appel `a l’automatisation des processus de d´emonstration. Cette automatisation est due `a la complication (et non `a la complexit´e) des tˆaches `a r´ealiser. De plus, nous avons observ´e que les m´ethodes de raisonnement sont associ´ees `a des outils de simulations num´eriques.

Notons ´egalement que lorsque l’analyse math´ematique du mod`ele th´eorique d’un syst`e-me est impossible, ou tout au moins trop difficile, le scientifique est asyst`e-men´e `a le simuler.

´

Evidemment, nous parlons ici, de la simulation num´erique. La simulation permet, de mettre en œuvre le syst`eme `a partir de conditions initiales, pour en ´etudier la dynamique.

Il est d’usage de regrouper la simulation, l’automatisation des processus de d´emonstration et plus g´en´eralement, l’ex´ecution de tout algorithme utile `a l’´etude du vivant sous l’appella-tion (( calculs in silico )).

math´ematique (sans simulation). Mais, cette pr´esentation nous a montr´e que la dynamique des populations, la th´eorie du chaos, les fractales, l’alg`ebre de processus, les r´eseaux de Petri et l’application BIOCHAM, faisaient intervenir la simulation num´erique conjointement `a cette analyse. Nous pouvons donc distinguer deux types d’analyse :

• l’analyse (( logique )) du mod`ele pour d´ecouvrir des propri´et´es, a priori, sans le simuler ; • l’analyse (( num´erique )) de la dynamique d’un syst`eme `a partir des r´esultats de sa(ses)

simulation(s) num´erique(s).

Finalement, nous affirmons que la simulation demeure la composante principale des calculs in silico. En effet, dans la plupart des ´etudes biologiques utilisant l’outil informatique, la simulation repr´esente la seule partie automatis´ee du raisonnement in abstracto2.

Forts de cette constatation, nous allons nous int´eresser plus particuli`erement `a la partie des recherches in silico qui n’aspire pas `a la pratique de l’analyse logique du mod`ele a priori, mais fournit des moyens de simulation aux biologistes. Le soin de l’analyse num´erique est ainsi laiss´e `a l’expertise du biologiste. Ainsi par la suite, nous utiliserons souvent les termes in silico et (( simulation )) comme synonymes.

2.3.5 La granularit´e des mod`eles

Au long de la section 2.2 sur les formalismes (( bio-logiques )), nous avons d´ej`a remarqu´e que les simulations font appel `a des mod`eles d´ecrits `a diff´erents niveaux. Trois termes qui servent `a l’origine `a d´esigner une ´echelle d’observation de ph´enom`enes physiques, peuvent ˆetre utilis´es pour d´ecrire la granularit´e d’un mod`ele, suivant le point de vue du mod´elisateur. Il s’agit des ´echelles microscopique, m´esoscopique et macroscopique.

2.3.5.1 Microscopique

Le niveau microscopique consiste `a mod´eliser individuellement chaque entit´e qui compose un syst`eme. Il fait appel `a une description locale des mod`eles. Le comportement global du syst`eme pourra alors ´emerger de la simulation de l’ensemble des mod`eles microscopiques. L’´echelle microscopique est le moyen le plus pr´ecis pour d´ecrire un ph´enom`ene. Bien sou-vent les m´ethodes utilis´ees ne sont pas d´eterministes du fait de leur caract`ere al´eatoire. En g´en´eral, les mod`eles sont spatialis´es. Les syst`emes multi-agents se prˆetent bien `a ce type de mod´elisation (section 2.4.5).

Si on s’int´eresse `a la cin´etique chimique, les dimensions temporelles et spatiales sont `a l’´echelle de la mol´ecule (nanosecondes, angtr¨oms). `A cette ´echelle, chaque esp`ece mol´eculaire est repr´esent´ee individuellement. La simulation consiste alors `a faire se mouvoir ces diff´erentes esp`eces mol´eculaires au sein d’un volume et `a les faire ´eventuellement r´eagir lorsqu’elles entrent en collision. L’espace doit obligatoirement ˆetre pris en compte, c’est pourquoi on ne distingue pas mod´elisation temporelle et mod´elisation spatio-temporelle. L’espace des ´etats est donn´e par la liste des positions et ´eventuellement orientations des diff´erentes esp`eces mol´eculaires. Les trajectoires suivies peuvent ˆetre discr`etes ou continues. En effet, les d´epla-cements des esp`eces mol´eculaires sont reproduits par des marches al´eatoires qui se font, soit dans un espace discret, soit dans un espace continu. Dans les deux cas, les d´eplacements ainsi que les r´eactions induites par les collisions entre les diverses esp`eces mol´eculaires sont donn´es par des lois probabilistes : le comportement du syst`eme est alors stochastique. Les 2Pour ˆetre plus pr´ecis, nous devons distinguer l’analyse num´erique, du raisonnement in abstracto. Le calcul num´erique entraˆıne des erreurs telles les approximations sur les r´eels. Il n’est donc plus strictement ´equivalent au monde des id´ees. Le calcul in silico repose sur le raisonnement in abstracto.

L’av`enement de la simulation num´erique

m´ethodes utilis´ees sont donc de type (( Monte Carlo )) [Takahashi and Tomita, 2005]. Compte-tenu de la puissance de calcul requise par ce type de simulations, les techniques et m´ethodes informatiques pour la simulation de la cin´etique biochimique `a l’´echelle microscopique sont pour l’instant peu d´evelopp´ees, le travail de recherche en informatique dans ce domaine en est encore `a son d´ebut.

2.3.5.2 Macroscopique

La simulation d’un syst`eme mod´elis´e au niveau microscopique est souvent d´emesur´ement coˆuteuse en puissance de calcul, du fait du nombre d’entit´es consid´er´ees. Pour pallier ce probl`eme les mod´elisateurs ont recours `a la simulation `a l’´echelle macroscopique. Ce niveau de granularit´e, consid`ere le comportement global d’une population.

Dans l’exemple de la r´eaction chimique, cela revient `a mod´eliser l’´evolution globale et continue des populations de mol´ecules. En effet, il est souvent possible d’extrapoler le com-portement global d’une population en faisant la moyenne des comcom-portements observ´es au niveau microscopique. De plus, en chimie, ce sont bien les concentrations que l’on observe exp´erimentalement et non le comportement individuel des mol´ecules. La plupart des lois exprim´ees et utilis´ees en sciences physiques sont ainsi de nature macroscopique, car c’est l’´echelle naturelle d’observation de la plupart des ph´enom`enes. L’´echelle macroscopique est le domaine quasi exclusif des ´equations diff´erentielles. Les m´ethodes de r´esolution num´erique pr´esent´ees dans la section 2.1.1 et la dynamique des populations (voir section 2.1) s’inscrivent dans ce cadre.

2.3.5.3 M´esoscopique

Parfois, il est impossible de d´ecrire correctement un ph´enom`ene au niveau macroscopique car la quantit´e d’entit´es mises en jeu au niveau microscopique est trop faible pour extra-poler une loi globale d’´evolution de la population sans s’int´eresser aux interactions locales. L’hypoth`ese de continuit´e n’est plus valable. Cette situation conduit naturellement `a affiner la granularit´e du mod`ele pour l’´etudier au niveau microscopique. Mais, la quantit´e d’entit´es peut tout de mˆeme s’av´erer assez ´elev´ee pour interdire une simulation `a l’´echelle microsco-pique demeurant trop coˆuteuse. De plus, il est souvent tr`es difficile de mod´eliser l’espace dans lequel se d´eroule les ph´enom`enes locaux.

L’´echelle m´esoscopique permet alors de proposer une solution pour simuler de tels ph´eno-m`enes en se pla¸cant `a un niveau interm´ediaire entre le mod`ele d’individu et celui de popula-tion.

Dans l’exemple de la mod´elisation de la cin´etique chimique, l’utilisation des ´equations diff´erentielles repose sur un certain nombre d’hypoth`eses. On suppose par exemple que les concentrations d’esp`eces chimiques ´evoluent de mani`ere continue et d´eterministe. Il se trouve que la faible quantit´e de mol´ecules impliqu´ees dans les r´eactions intra-cellulaire (quelques centaines, ou mˆeme une seule si on parle d’un brin d’ADN) compromet ces hypoth`eses [Arkin et al., 1998].

La simulation (( stochastisque exacte )) est une m´ethode probabiliste pour r´ealiser la simu-lation `a ce niveau de mod´elisation. L’algorithme de Gillespie [Gillespie, 1976] tient toujours compte du nombre de mol´ecules mais ne se pr´eoccupe ni de leur position ni de leur mo-ment cin´etique. Les variables repr´esentant les nombres de mol´ecules varient discr`etemo-ment. On calcule la probabilit´e de collision entre deux mol´ecules par unit´e de temps et de volume. On parle alors de probabilit´e de r´eaction. A ce niveau, la mod´elisation et la simulation de larges syst`emes sont plus ais´ees qu’aux niveau microscopique. Divers algorithmes ont ´et´e

pro-pos´es successivement pour la simulation stochastique exacte en milieu homog`ene [Gibson and Bruck, 2000; Cao et al., 2004] et en milieu h´et´erog`ene [Ander et al., 2004; Elf and Ehrenberg, 2004].

2.3.6 Vers une simulation multi-´echelles

Il faut garder `a l’esprit que la notion de granularit´e n’a de sens que par rapport `a l’objet mod´elis´e. Ainsi, si nous mod´elisons un syst`eme de cellules et que chaque cellule est vue comme un r´eacteur chimique ind´ependant mettant en œuvre un syst`eme d’´equations diff´erentielles, nous observons `a la fois une granularit´e microscopique du syst`eme cellulaire et une granu-larit´e macroscopique des ph´enom`enes mol´eculaires. Pour aller plus loin, la rigueur impose de mod´eliser certaines r´eactions au niveau m´esoscopique car les concentrations au sein de la cellule ne sont pas suffisantes. Ce faisant, le mod`ele m´elange les visions macroscopique et m´esoscopique du niveau mol´eculaire. Ce simple exemple nous montre qu’une simulation de syst`eme vivant est amen´ee `a consid´erer et `a int´egrer des ph´enom`enes qui se r´ealisent `a plusieurs niveaux de description.

Lorsqu’un mod`ele fait intervenir plusieurs granularit´es dans sa description, la simula-tion doit mettre en œuvre des calculs qui se passent `a des ´echelles de temps et d’espace tr`es diff´erentes. Par exemple, une r´esolution au niveau macroscopique d’une r´eaction enzymatique se calcule avec un pas de temps compris entre 10−3 et 10−6 seconde ; alors qu’une simulation de type microscopique de cette mod´elisation fait intervenir des pas de temps de 10−9 `a 10−12

seconde. La cohabitation d’´echelles de calculs tr`es diff´erentes au sein des simulations conduit `

a la notion de (( simulation de mod`ele multi ´echelles )).

Nous avons choisi de nous concentrer sur les outils permettant la simulation. La simula-tion, calculs in silico, vient compl´eter le raisonnement in abstracto et les exp´erimentations in vivo et in vitro. La simulation multi-´echelles est une propri´et´e essentielle permettant de m´elanger les niveaux de description microscopique, m´esoscopique et macroscopique. Si nous poussons plus avant cette id´ee de simulation multi-´echelles, nous pouvons commencer `a en-trevoir la notion de (( simulation multi-mod`eles )). La section suivante est d´edi´ee aux outils la mettant en œuvre.

2.4 Types d’architectures pour les simulations in