• Aucun résultat trouvé

5. Formalismes pour la modélisation simultanée

5.4. Modèles à base de contraintes

5.4.3. Réaction de production de biomasse

La croissance bactérienne peut être modélisée en introduisant dans un mbc une pseudo-réaction qui décrit les métabolites nécessaires (considé- rés comme des substrats de la réaction) pour produire une nouvelle cellule (produit de la réaction). Cette pseudo-rédaction de production de biomasse est considéré comme un flux d’échange qui va de l’intérieur vers l’extérieur du système.

5.4. Modèles à base de contraintes

Figure 5.14. – Espace des solutions a) sans contraintes, b) avec des contraintes d’in- égalité, et c) avec des contraintes d’inégalité et une contrainte d’égalité.

5. Formalismes pour la modélisation simultanée

On peut déterminer expérimentalement la composition en macromolécules d’une cellule (les protéines, les lipides. . .). Si l’on connait suffisamment le métabolisme de la bactérie, il est aussi possible de déterminer les méta- bolites précurseurs nécessaires pour produire chacune de ces macromolé- cules. La table 5.2 donne un exemple d’une telle « conversion » pour les acides aminés qui constituent les protéines d’E. coli. En tenant compte des proportions respectives de chaque constituant, on peut alors exprimer la production de biomasse en termes de métabolites précurseurs et d’énergie nécessaires pour produire un gramme de biomasse. La table 5.3 donne un exemple pour E. coli. Ces informations sont ensuite réécrites sous la forme d’une pesudo-réaction qui est intégrée au mbc :

205 × glucose 6-p + 70, 9 × fructose 6-p + · · · ⇒ 1 × biomasse + . . .

5.4.4. Résultats générés

Les modèles à base de contraintes permettent d’obtenir une ou plusieurs cartes de flux qui décrivent la répartition et la vitesse des réactions (et des transports) au sein d’un réseau métabolique.

Ces cartes de flux peuvent être considérées comme des « clichés » qui ré- vèlent l’état du métabolisme à un moment donné. La période de temps pendant laquelle une carte de flux est pertinente va dépendre de la durée pendant laquelle le système est à l’état stationnaire. Cette durée peut varier de quelques minutes jusqu’à plusieurs jours, par exemple lors de cultures bactériennes en chemostat (avec renouvellement en continu du milieu de culture).

Si l’on dispose des connaissances suffisantes pour contraindre totalement l’espace des solutions, il est possible d’obtenir une seule carte de flux. Lorsque le réseau est sous-déterminé (le nombre de flux est supérieur au nombre de métabolites) ou que les connaissances ne sont pas suffisantes, l’espace des solutions ne peut pas être pas totalement contraint. En consé- quence, plusieurs cartes de flux sont possibles.

Différentes extensions existent afin de gérer cette multiplicité de solution, dont certaines seront présentées plus loin dans cette thèse. De manière simple, ces méthodes permettent soit de ne choisir qu’une seule carte parmi toutes celles possibles, soit d’analyser la variabilité des solutions possibles.

5.4. Modèles à base de contraintes

Table 5.2. – Composition en acides aminés des cellules d’E. coli et besoins en méta- bolites précurseurs. Souche B/r, données issues de [Neidhardt 1990].

Quantité présente (μmol/g de cellule)

Besoins en précurseurs pour produire chaque acide aminé (μmol/μmol)

Acide aminé Métabolites† atp nadh†† nadph

Alanine 488 1 pyr 0 0 1 Arginine 281 1 akg 7 −1 4 Asparagine 229 1 oa 3 0 1 Aspartate 229 1 oa 0 0 1 Cystéine 87 1 3pg 4 −1 5 Glutamate 250 1 akg 0 0 1 Glutamine 250 1 akg 1 0 1 Glycine 582 1 3pg 0 −1 1 Histidine 90 1 r5p 6 −3 1

Isoleucine 276 1 oa, 1 pyr 2 0 5

Leucine 428 2 pyr, 1 accoa 0 −1 2

Lysine 326 1 oa, 1 pyr 2 0 4

Méthionine 146 1 oa 7 0 8

Phénylalanine 176 1 e4p, 2 pep 1 0 2

Proline 210 1 akg 1 0 3

Sérine 205 1 3pg 0 −1 1

Thréonine 241 1 oa 2 0 3

Tryptophane 54 1 r5p, 1 e4p, 1 pep 5 −2 3

Tyrosine 131 1 e4p, 2 pep 1 −1 2

Valine 402 2 pyr 0 0 2

3pg, 3-phosphoglycérate ; accoa, acétyl-CoA ; akg, α-kétoglutarate ; e4p, érythrose 4-phosphate oa, oxaloacétate ; pep, phosphoénol pyruvate ; pyr, pyruvate ; r5p, ribose 5-phosphate ;

††

Une valeur négative indique que la synthèse de l’acide conduit à la production de nadh.

Table 5.3. – Métabolites précurseurs et énergie nécessaires pour produire un gramme de cellule d’E. coli. Souche B/r, données issues de [Neidhardt 1990].

Métabolite précurseur Quantité (μmol/g de cellule) Métabolite précurseur Quantité (μmol/g de cellule) Glucose 6-p 205 Pyruvate 2 832,8 Fructose 6-p 70,9 Acétyl-CoA 3 747,8 Ribose 5-p 897,7 α-kétoglutarate 1 078,9 Érythrose 4-p 361 Oxaloacétate 1 786,7 Glycéraldéhyde 3-p 129 atp 18 485 3-phosphoglycérate 1 496 nadph 18 225

5. Formalismes pour la modélisation simultanée

La modélisation à base de contraintes a donné lieu a de nombreux tra- vaux. Parmi ceux-ci, citons la modélisation de métabolismes « complets » (« genome-scale ») [Kim 2012]. Par exemple Weaver et coll. ont construit un modèle chez E. coli décrivant 2 286 réactions et 1 453 métabolites [Weaver 2014]. D’autres modèles complets ont aussi été construits pour des orga- nismes pluricellulaires, tels que les plantes [de Oliveira Dal’Molin 2013]. Les mbc ont de nombreuses applications ([Price 2004a, Bordbar 2014]). Ils permettent, par exemple, d’évaluer la réorganisation des flux selon les conditions environnementales [Almaas 2004], de comparer les répartitions de flux chez des souches bactériennes différentes [Coze 2013], ou encore d’étudier la compétition pour les ressources entre deux populations bacté- riennes [Zhuang 2011].

5.4.5. Avantages et inconvénients

La modélisation à base de contraintes ne nécessite pas de connaitre les paramètres cinétiques des réactions, cela permet de modéliser des réseaux de grandes tailles.

Par ailleurs, les vitesses de consommation ou de production de métabolites, couramment mesurées lors de l’étude du métabolisme, sont facilement inté- grables : ces informations peuvent être directement traduites en contraintes sur les flux d’échange du système.

Un autre type de donnée classiquement mesurée lors de l’étude des proca- ryotes est la production de biomasse. Comme abordé plus en amont, cette production de biomasse peut être décrite dans un mbc comme un flux de sortie du système.

La modélisation à base de contraintes a aussi des désavantages. Par construc- tion, un modèle à base de contraintes ne peut pas considérer la dynamique du système, puisque l’on suppose que ce système est à l’état stationnaire. Cela pose notamment des limites si l’on souhaite étudier le comportement d’un métabolisme dans un environnement changeant. Une façon de contour- ner ce problème est de considérer la dynamique du système comme étant une succession d’états stationnaires (hypothèse d’état quasi-stationnaire). Sur cette base, on peut ainsi générer une ou plusieurs cartes de flux repré- sentatives de chaque état. Ce type d’approche a par exemple été utilisé par Covert et Palsson pour modéliser la dynamique du métabolisme chez E. coli à l’aide d’un mbc [Covert 2002].

5.4. Modèles à base de contraintes

Un second inconvénient est le fait qu’un modèle peut déboucher sur plu- sieurs cartes de flux solutions. Cela peut notamment poser des difficultés lorsque l’on souhaite modéliser la dynamique du système en calculant une succession de cartes de flux.

Un autre limite est l’impossibilité de considérer directement les concen- trations des entités du système — métabolites, enzymes et transporteurs — que ce soit lors de la construction du modèle, ou lors de l’analyse des cartes de flux solutions, puisque les mbc considèrent que la concentration des métabolites internes n’évolue pas (dm/dt = 0).

5.4.6. Considérations sur la modélisation simultanée

Des approches qui utilisent les modèles à base de contraintes ont déjà été développées pour modéliser simultanément un réseau de régulation et un réseau métabolique. Lee et coll. ont ainsi présenté un travail où les réseaux sont décrit à l’aide d’un mbc [Lee 2008]1 (modélisation intégrée, utilisant

les matrices stœchiométriques). Covert et coll. ont quant à eux utilisé un modèle logique pour décrire le réseau de régulation, et une combinaison d’un modèle à base de contraintes et d’équations différentielles pour décrire le métabolisme [Covert 2008] (modélisation couplée). Ces deux travaux ont porté sur des réseaux de taille « moyenne » (de l’ordre de 50 à 100 réactions, environ 10 régulateurs transcriptionnels). Plus récemment, Karr et coll. ont développé une approche « cellule complète » dans laquelle la description du métabolisme utilise la modélisation à base de contraintes [Karr 2012]. Les régulations génétiques se font en réponse à des stimuli, et ces réponses entrainent ensuite des modification du fonctionnement du métabolisme. Cette dimension dynamique pose une première difficulté dans le cadre de la modélisation à base de contraintes : puisque les mbc supposent l’état stationnaire du système, la vitesse des flux — dans un mbc du métabo- lisme — ou le niveau d’expression des gènes — dans un mbc du réseau de régulation génétique — sont constants dans chaque carte solution.

En conséquence, la modélisation simultanée d’un réseau de régulation gé- nétique et d’un réseau métabolique passe nécessairement par la génération d’une succession de cartes solutions, où chaque carte représente un état transitoire du système. Il faut alors définir comment l’état du système à

5. Formalismes pour la modélisation simultanée

un instant t détermine les contraintes du système pour un instant suivant t + 1.

Le réseau de régulation agit sur le métabolisme en régulant la concentration d’une enzyme, concentration qui peut ensuite avoir une influence sur la vitesse de la réaction catalysée. Si le métabolisme est modélisé avec un mbc, l’effet de la modification de la concentration d’une enzyme peut être modélisé en modifiant les contraintes sur le flux associé à cette enzyme. Ce type de couplage a été utilisé par Covert et coll. [Covert 2001]. Dans ce travail, un modèle logique décrit le réseau de régulation génétique, et un mbc décrit le métabolisme. Chaque protéine du rrg ne peut avoir que deux états : présente ou absente. Lorsqu’une enzyme est absente, la vitesse du flux associé est contrainte à 0 dans le mbc. Une manière plus fine de réguler les flux est d’utiliser des contraintes d’inégalité, afin de définir la vitesse maximale d’un flux en fonction du niveau d’expression de l’enzyme. Cependant, il faut noter que le niveau d’expression d’une enzyme n’est pas toujours corrélé à la vitesse d’une réaction dans un contexte in vivo : la concentration en enzyme active peut être régulée par des phénomènes de régulation post-traductionnelle, comme c’est le cas pour l’enzyme isocitrate dehydrogenase chez E. coli [Cozzone 2005].

L’action du métabolisme sur le réseau de régulation génétique dépend de la concentration des métabolites. Or, le résultat d’un mbc du métabolisme est une carte de flux, qui ne donne pas d’information sur le niveau de concen- tration des métabolites. Le couplage avec un modèle du rrg nécessite donc un travail de « traduction » des vitesses de flux vers des concentrations en métabolites (ces concentrations pouvant être exprimées de manière qualita- tive ou quantitative, selon la méthode utilisée pour modéliser le rrg). Une piste éventuellement intéressante est l’utilisation des propriétés thermody- namiques des réactions, afin d’estimer des jeux de concentrations thermody- namiquement compatibles avec le sens et la vitesse des flux [Beard 2005]. Une autre piste est de modéliser le métabolisme en utilisant de manière combinée la modélisation à base de contraintes et les équations différen- tielles [Smallbone 2010].

Un dernier point important dans le cadre du couplage rrg ↔ rm est la différence de vitesse des processus. Au niveau du métabolisme la vi- tesse des réactions chimiques change rapidement lorsque la concentration des substrats ou des produits évolue (changement de l’ordre de quelques secondes, [Mashego 2006]). Au niveau du réseau de régulation génétique, l’activation d’un gène nécessite un certain délai avant que le produit soit

5.4. Modèles à base de contraintes

exprimé et fonctionnel (de l’ordre de quelques minutes, [Zubay 1973,McA- dams 1998]).

Troisième partie

Dynamique d’un réseau métabolique avec un

modèle à base de contraintes : approche par

Suite à mon travail de revue sur les formalismes de modélisation, la mo- délisation à base de contraintes est apparue comme très puissante pour étudier les réseaux métaboliques : le fait que les mbc ne nécessitent pas de paramétrage permet l’étude de ces réseaux même lorsque les connaissances sont incomplètes.

Revers de la médaille, la dimension dynamique ne peut être prise en compte directement dans les mbc, puisque l’on pose l’hypothèse que le système étudié est à l’état stationnaire. De plus, lorsque l’espace des solutions n’est pas suffisamment contraint, la répartition des flux ne peut être estimée de manière unique — le système est dit sous-déterminé.

Afin d’élargir le champ des applications des mbc, de nombreuses approches ont été proposées pour (i ) gérer la multiplicité des cartes solutions, ou (ii ) produire une dynamique à l’aide du formalisme des mbc, voire (iii) com- biner ces deux caractéristiques. Je présente quelques-unes de ces approches dans le chapitre6 (p. 99).

La dynamique d’un réseau métabolique peut être intégrée dans un mbc en considérant que le système passe par une succession d’états stationnaires. Dans cette approche, le temps est discrétisé en périodes, et le « poten- tiel » de fonctionnement du système est décrit pour chaque période par un espace des solutions contraint par des valeurs spécifiques (les valeurs des contraintes dépendent de la période de temps).

Les mbc dynamiques sont notamment utilisés pour modéliser le fonctionne- ment du métabolisme des bactéries au cours d’une culture. Dans ce cadre, les flux d’échange entre le système et l’environnement extérieur sont typi- quement les flux de consommation de substrats et de production de bio- masse. Ces flux d’entrées / sorties (flux e/s) sont généralement déterminés à partir de mesures expérimentales, réalisées à différents moments de la culture, et servent à contraindre l’espace des solutions de manière temps dépendant.

La variabilité est une composante fondamentale de l’étude des systèmes biologiques. Cette variabilité résulte d’une part de différences de fonction- nement entre les cellules d’une même population, et d’autre part de la chaîne des manipulations nécessaires pour effectuer des mesures sur les en- tités et processus biologiques (technicité de l’expérimentateur, qualité de l’équipement, précision des dispositifs. . .). La variabilité mesurée expéri- mentalement peut être « traduite » dans les mbc en utilisant des contraintes d’inégalité sur les flux (plutôt que des contraintes d’égalité). Ainsi, un flux

d’entrée ve dans le système peut être exprimé par une contrainte d’égalité,

par exemple ve,glu = 10 (mmol/h). Toujours pour l’exemple, si l’on sait

que ce flux varie entre 8 et 12 (mmol/h), on peut reformuler la contrainte d’égalité par deux contraintes d’inégalité : 8 ≤ ve,glu ≤ 12.

Lorsque la quantité de données est faible et que de la variabilité est intro- duite sur les contraintes, la répartition des flux dans le réseau ne peut pas être estimée de manière unique : il existe différentes répartitions de flux qui sont toutes en accord avec les données à disposition. Une manière de choi- sir parmi toutes les répartitions possibles est alors de poser une hypothèse sur un phénomène biologique qui serait optimisé au sein du métabolisme étudié. Typiquement, l’hypothèse sera que le système optimise la produc- tion de biomasse ou d’énergie. Cependant, le « but » vers lequel tend le métabolisme n’est réellement connu que dans certaines situations.

Plutôt que de choisir une carte particulière, une autre manière de gérer la multiplicité des cartes solutions est d’évaluer l’espace des solutions en entier. En sélectionnant aléatoirement des cartes de flux solutions, l’échan- tillonnage de l’espace des solutions permet ainsi d’estimer la variabilité et la distribution de probabilité de chacun des flux du système.

Bien que conceptuellement intéressante, la prise en compte de la variabi- lité dans les mbc dynamiques est encore relativement peu étudiée. Compte tenu des améliorations qu’il était possible d’apporter aux méthodes mbc, mon sujet de thèse a évolué vers la recherche d’une approche qui utilise les méthodes mbc pour modéliser la dynamique du métabolisme, considéré indépendamment de la régulation, et ce lorsque la quantité de données est faible et sans poser d’hypothèse sur l’optimum du système métabolique. L’enjeu majeur autour du développement d’une telle méthode est de per- mettre d’estimer de manière fine la variabilité des flux dans les modèles mbc dynamiques.

En associant le formalisme des mbc avec l’échantillonnage de l’espace des solutions, j’ai mis au point une nouvelle approche qui permet d’estimer au cours du temps les densités de distribution des valeurs de flux. La dyna- mique du système y est évaluée en calculant une population de trajectoires solutions, où chaque trajectoire est constituée d’une succession de cartes solutions. En introduisant une contrainte de faisabilité entre les cartes de chaque trajectoire, la méthode permet de faire des prédictions plus réalistes, et de réduire la variabilité des flux prédits.

Cette méthode est présentée sous la forme d’un article dans le chapitre 7

(p. 129). Afin d’illustrer les capacités de la méthode, je l’ai appliquée pour modéliser le comportement du métabolisme de la bactérie Corynebacterium glutamicum lors de la croissance en limitation en biotine. Les résultats obtenus sont aussi abordés au fil de l’article.

Dans le chapitre8(p.161), j’approfondis plusieurs points brièvement abor- dés dans l’article, notamment, le choix de la méthode d’échantillonnage, et le choix des paramètres de l’approche. Le chapitre 9 (p. 187) est ensuite l’occasion de discuter d’une part, de l’impossibilité de modéliser l’une des périodes de la culture de C. glutamicum, et d’autre part de montrer en quoi les prédictions peuvent être utilisées pour améliorer le modèle. En- fin, le chapitre 10(p. 223) conclut ce travail de thèse, et propose quelques éléments de réflexions pour la conception d’autres approches.

Chapitre 6

Gestion de la multitude de solutions et de la

dynamique dans les

MBC

Depuis plus de 30 ans, les mbc sont utilisés pour modéliser les réseaux métaboliques. Au fil des années, de nombreux développements sont venus améliorer le principe de base de ce formalisme. Les récents articles de revue de Bordbar et coll. [Bordbar 2014], et de Lewis et coll. [Lewis 2012] illustrent bien la quantité et la diversité des approches basées sur les mbc. Dans le premier, les auteurs proposent de revenir sur des résultats récemment obtenus grâce aux mbc. L’article est accompagné d’une base de données qui référence plus 600 travaux scientifiques publiés entre 1986 et 20131 (figure 6.1).

Figure 6.1. – Nombre d’articles publiés sur les mbc de 1985 à 2013. Figure associée à [Bordbar 2014], issue dehttp://sbrg.ucsd.edu/cobra-predictions.

6. Gestion de la multitude de solutions et de la dynamique dans les MBC

Dans le second article, les auteurs proposent une « phylogénie » des ap- proches existantes, regroupées selon quelques caractéristiques (figure 6.2). Une liste de méthodes, ainsi qu’une liste de packages logiciels dédiés aux mbc, a été mise en ligne par les auteurs2. Un troisième article de revue particulièrement intéressant, qui présente entre autre les différents types d’analyses réalisables à partir d’un modèle mbc, est celui de Durot et coll. [Durot 2009].

Dans ce chapitre, je vais me concentrer sur deux caractéristiques : la gestion de la multitude de solutions lorsque le réseau est sous-déterminé, et la production d’une dynamique.

2. En ligne,http://cobramethods.wikidot.com, accédé le 15 janvier 2015

Figure 6.2. – Représentation « phylogénique » des approches mbc. Figure issue de [Lewis 2012].

6. Gestion de la multitude de solutions et de la dynamique dans les MBC

6.1. Gestion de la multitude de solutions