• Aucun résultat trouvé

L’enjeu du développement d’approches de modélisation pour décrire le fonc- tionnement combiné d’un rrg et d’un rm est à la fois biologique et mé- thodologique.

3.2.1. Enjeu biologique

Il y a un enjeu biologique, car la modélisation intégrée de plusieurs ré- seaux biologiques permet d’avoir une vision plus globale des phénomènes qui régissent le comportement d’une cellule.

Si l’on ne considère qu’un seul réseau biologique, un modèle de ce réseau ne tiendra compte que d’un nombre limité d’entités biologiques et de rela- tions. Par exemple, la modélisation du métabolisme prendra en compte les enzymes et les métabolites en tant qu’entités, et les réactions et les trans- ports en tant que relations. Du fait du périmètre limité d’un tel modèle, il ne sera pas possible d’étudier la régulation de l’expression des gènes codant les enzymes, ou encore les mécanismes qui permettent à la cellule d’adapter son métabolisme selon les conditions environnementales.

Une vision intégrée d’un système vivant ouvre de nombreuses perspectives. Par exemple, il devient possible d’étudier l’impact de la modification d’une entité biologique sur le reste du système, à la fois au niveau du métabo- lisme et du réseau de régulation génétique. Par ailleurs, la modélisation du

3.2. Enjeux autour de la modélisation simultanée

couplage rm ↔ rrg permet d’identifier des boucles de régulation entre les deux réseaux.

Le besoin d’une vision systémique du fonctionnement des cellules est au- jourd’hui accru par l’arrivée de nombreuses données « -omiques », produites par les techniques de transcriptomique, de protéomique ou encore de mé- tabolomique. Ces données fournissent, à l’échelle de la cellule entière, une grande quantité d’informations. Par exemple, la métabolomique permet d’obtenir simultanément la concentration intracellulaire de nombreux mé- tabolites [Patti 2012].

Mais les données « -omiques » ne fournissent pas d’information directe sur les mécanismes cellulaires, sur les causes et sur les conséquences des va- leurs mesurées. En conséquence, l’interprétation de ces données nécessite l’utilisation de diverses connaissances préalablement acquises. Les modèles, en particulier les modèles multi-réseaux, représentent une aide précieuse pour l’exploitation des données « -omiques ». Par exemple, Colijn et coll. utilisent un modèle métabolique pour comprendre l’impact d’un profil d’ex- pression du génome (données de transcriptomique) sur le fonctionnement du métabolisme [Colijn 2009].

De manière générale, le fait de prendre en compte l’état des deux réseaux permet aux modèles de générer des résultats plus pertinents. Des publica- tions récentes montrent par ailleurs que d’autres phénomènes, notamment les régulations post-traductionnelles et le réseau de signalisation, jouent aussi un rôle important [Chubukov 2013].

3.2.2. Enjeu méthodologique

Le développement d’approches pour la modélisation simultanée de (i ) l’ef- fet des régulations génétiques sur le fonctionnement du métabolisme et de (ii ) l’effet retour du métabolisme représente aussi des enjeux méthodolo- giques.

Les rrg et les rm peuvent être modélisés en utilisant différents forma- lismes [Machado 2011]. Certaines familles de formalismes peuvent servir pour modéliser l’un et l’autre des réseaux, comme les équations différen- tielles (modèles à bases d’équations différentielles). D’autres formalismes sont plus adaptés pour modéliser l’un des réseaux. C’est le cas du forma- lisme logique, adapté à la modélisation des réseaux de régulation (modèles

3. Biologie du couplage et enjeux de la modélisation simultanée

logiques), ou des matrices stœchiométriques pour la modélisation des ré- seaux métaboliques (modèles à base de contraintes).

Compte tenu des formalismes aujourd’hui disponibles, la modélisation si- multanée des deux réseaux peut se faire selon deux approches. Une première approche est de construire un modèle intégré, qui utilise un même forma- lisme pour modéliser les deux réseaux. L’utilisation d’un même formalisme facilite la description des interactions entre les deux réseaux. La deuxième approche est de construire un modèle couplé, qui utilise un formalisme dif- férent pour chaque réseau. Les formalismes étant différents, il est nécessaire de définir comment les deux modèles interagissent entre eux.

À l’heure actuelle, dans la majorité des travaux scientifiques, les modèles ne décrivent qu’un seul réseau biologique au moyen d’un unique formalisme. Parmi les travaux qui mettent en jeux les deux réseaux, les méthodes dé- veloppées portent principalement sur un couplage « unidirectionnel », où seul l’effet de l’un des réseaux sur l’autre est pris en compte : action du modèle métabolique sur le modèle de régulation ou action du modèle de régulation sur le modèle métabolique. Par exemple, Covert et coll. ont dé- veloppé la méthode rFBA (regulatory Flux Balance Analysis), où chaque réseau est décrit au moyen d’un formalisme différent (modèle logique pour le réseau de régulation, modèle à base de contraintes pour le réseau mé- tabolique [Covert 2003]). Grâce à cette méthode, les prédictions issues du modèle de réseau de régulation sont utilisées pour améliorer les prédictions sur le fonctionnement du métabolisme d’E. coli.

Enfin, certaines méthodes permettent une modélisation « bidirectionnelle » des deux réseaux (prenant en compte les effets réciproques). Simão et coll. ont ainsi développé une méthode basée sur un unique formalisme, les ré- seaux de Petri [Simão 2005]. Un autre exemple est celui de la méthode idFBA (integrated dynamic Flux Balance Analysis), développée par Lee et coll. [Lee 2008].

Dans le contexte de la biologie des systèmes, des méthodes permettant d’in- tégrer le métabolisme et la régulation génétique sont aujourd’hui souvent citées parmi les outils les plus en vue afin d’améliorer notre compréhension du fonctionnement des cellules. Un autre enjeu méthodologique important est l’intégration, la prise en compte des résultats expérimentaux dans des modèles multi-réseaux.

Chapitre 4

Caractéristiques pour le choix du formalisme

La difficulté de la modélisation simultanée de plusieurs réseaux biologiques est liée, d’une part, à la complexité de la réalité biologique, et d’autre part, aux contraintes imposées par chaque formalisme.

Les relations entre les entités changent selon le réseau biologique consi- déré. Un rrg véhicule principalement des flux d’information (les gènes contiennent l’information génétique, les régulateurs modulent l’expression de cette information), tandis qu’un rm fait intervenir des flux de matière (transport et transformation de métabolites).

D’autre part, comme l’expriment si bien Machado et coll. [Machado 2011], Many of the proposed formalisms, such as Petri nets or pro- cess algebras, were originally created by the computational com- munity for the specification of software systems, where the final system has to comply to the model. The biological community faces the opposite problem, where the model has to mimic the system’s behavior, and where most components cannot even be measured directly.

les formalismes utilisés n’ont pas été créés pour la biologie, mais sont is- sus d’autres domaines scientifiques. En conséquence, l’utilisation de ces formalismes doit s’adapter à la complexité et l’incertitude inhérentes à la biologie.

Dans cette section, je présente les caractéristiques — biologiques et métho- dologiques — qu’il convient à mon sens de considérer lors de la conception d’une méthode de modélisation multi-réseaux.