Nous avons, pour l’instant, étudié la dynamique de petits motifs réels trouvés chez E. coli
Figure V.10 – Fonctions de quelques motifs. a) la boucle de rétroaction négative accélère la réponse à un signal donné. b) Le « feed forward loop » cohérent agit comme un détecteur de persistance. c) Le « feed forward loop » incohérent agit comme un générateur de pulse. Voir le code Matlab en annexe
Code11MotifAlon.mqui gènère cette figure.
gènes. Or le génome d’E. coli compte 4000 gènes. Peut-on passer à l’étape suivante et simuler la dynamique de fonctionnement de réseaux plus gros contenant 5,10, 25 ,200 puis 4000 gènes ? Si on met de coté les erreurs dues à l’utilisation de méthodes numériques, le formalisme ODE étudié dans ce chapitre n’a pas de limites intrinsèques et pourrait donc, en théorie, simuler un réseau de 4000 gènes sans difficulté. Pour un réseau très linéaire sans boucle de rétroaction,
V.7 Etudier la dynamique de réseaux plus gros
on peut augmenter le nombre de gènes sans trop diminuer la qualité des prédictions effectuées. Mais dés lors que le système devient non linéaire (boucles de rétroaction) ou que la connectivité (nombre de liens par nœud) augmente trop, les prédictions deviennent fortement dépendantes des conditions initiales et de la valeur numérique des paramètres. C’est ce qu’on appelle la dépendance sensitive aux conditions initiales (le populaire effet papillon). Pour proposer un exemple simple, une toute petite différence dans la valeur d’un paramètre (15,000007 par rap-port à 15,000008) aura des conséquences énormes sur le phénotype final : la cellule vit ou la cellule meurt. Pour couronner le tout, dites vous que ce problème existe dans un système déter-ministe et il est évidemment amplifié dans un système stochastique (c’est le cas de la cellule) ce qui accroit encore les incertitudes sur le phénotype final. Or malgré son réseau non linéaire au fonctionnement stochastique, la cellule réussit à se prémunir de cette dépendance sensitive aux conditions initiales de manière évidente. En effet, lors de son adaptation à divers stimuli, la population de cellules, via son réseau de régulation, semble réussir à basculer vers le phénotype adéquate en calculant la solution optimale et ce de manière reproductible et donc un minimum déterministe. Comment fait-elle ?
En électronique, un module est défini comme une unité fonctionnelle qui est capable de maintenir ses propriétés intrinsèques indépendamment de ses connections externes. C’est un concept important car il permet aux ingénieurs de connecter plusieurs éléments ensembles sur une puce tout en maintenant la capacité de prédire le comportement de l’ensemble (le résultat après assemblage). Beaucoup de biologistes pensent que pour être suffisamment robuste, le réseau d’un organisme vivant doit être composé de modules c’est-à-dire êtremodulaire (Hartwell
et al., 1999; Wolf & Arkin, 2003; Kashtan & Alon, 2005). Selon Gunter Wagner, la question n’est même plus tant de savoir si les réseaux sont modulaires, mais plutôt quelle est l’origine de cette modularité (sélection naturelle ?) et quelles sont ses conséquences sur « l’ évolvabilité » d’un organisme (Wagneret al., 2007).
Un des enjeux futurs de la biologie synthétique sera de construire ces réseaux modulaires dont on contrôle le comportement d’ensemble. Pour cela, il faudra assembler des petits mo-dules et utiliser le savoir faire de l’électronique pour minimiser les phénomènes de rétroactivité (Del Vecchioet al.,2008; Sauro,2008). Réussir à connecter ensembles quelques petits modules de 2 à 4 gènes et démontrer qu’on contrôle le fonctionnement global sera déjà une belle avancée. Pour cela, il faut selon moi, limiter la taille des modèles dynamiques (moins de 10–15 gènes). En effet, ces derniers doivent rester prédictifs de manière à permettre à l’expérimentateur d’utiliser ces prédictions pour ajuster les paramètres via les techniques de biologies moléculaires.
Il me semble que les novices ont tendance à sous-estimer la difficulté technique que repré-sente le contrôle quantitatif d’une seule interaction. Le passage du contrôle d’un réseau de n
interactions à n+1 peut prendre énormément de temps (mois, années). Le repressilator que nous avons étudié contient 3 gènes et 3 interactions et c’est un exploit technique qui prendrait des années à être reproduit par une équipe d’aujourd’hui.
En biologie synthétique, je pense qu’il faut privilégier les petits modèles (simples mais pas simplistes). Les gros modèles contenant des dizaines/centaines de gènes et métabolites sont beaucoup trop gros pour être réellement prédictifs au sens où je l’entends. Ces modèles ne peuvent pas me fournir une prédiction fiable m’indiquant comment modifier certains para-mètres de mon réseau pour adapter son comportement dynamique. Or la sureté des prédictions est primordiale car la modification de la séquence ADN pour ajuster un paramètre (biologie moléculaire) est très fastidieuse et peut prendre des mois. Pourtant et paradoxalement, les pré-dictions générées par ces gros modèles sont souvent justes. La raison est simple : le chercheur connaît son but et finit donc évidemment par l’atteindre. Comme le souligne Antoine Danchin, beaucoup de modèles redécouvrent le cycle de Krebs.
Pour faire de la biologie synthétique bottum-up, il faut vérifier et contrôler expérimentale-ment chaque interaction. Cela peut prendre du temps et se fait parfois dans la douleur mais c’est indispensable. Les interactions données sur les bases de données comme Ecocyc ou Regu-lonDB devraient être considérées comme fausses a priori jusqu’à confirmation expérimentale. Comprenez-moi bien, ce n’est pas une critique envers ces bases de données, ni envers le travail des chercheurs qui ont découverts ces interactions. C’est le constat qu’on se trouve ici à la frontière de la connaissance et cette connaissance reste relative et n’attend qu’à être amélioré. En biologie, ce qui est vrai dans un laboratoire sera faux dans celui d’à coté. Parfois, un cher-cheur qui décrit/propose une nouvelle interaction va, lui-même, ajouter du conditionnel dans sa publication initiale. Puis au fil des années et des publications citant cette interaction, le conditionnel disparait et petit à petit l’interaction devient sacrée. Pourquoi, dans les bases de données, n’y a t’il pas de chiffres, même indicatifs, associés à une interaction ? Par exemple, dans tel condition, ce facteur de transcription active d’un facteur 100 l’expression de ce gène ou au contraire, il ne l’active que de 2%. Il n’y a pas de chiffres car la résolution actuelle de nos expériences ne nous permet pas d’atteindre un tel niveau de standardisation. On est très loin de l’électronique.
Je donne un petit peu mes recettes de cuisine (qui n’engagent que moi) car il me semble que les novices ont parfois tendance à surestimer les informations de topologie. En biologie synthétique, ne faites pas confiance à une information a priori. Vérifiez là toujours par vous-même et rappelez vous que ce qui est facile en théorie est toujours difficile en pratique et ce qui est difficile en théorie est quasiment impossible en pratique.
Références bibliographiques
Alon, Uri. 2006. An introduction to system biology. Chapman and Hall/CRC. 114
Barabasi, Albert, & Bonaneau, Eric. 2010. Les reseaux invariants d’echelle. Pour la science.
112
Basu, S., Gerchman, Y., Collins, C. H., Arnold, F. H., & Weiss, R. 2005. A synthetic multicel-lular system for programmed pattern formation. Nature,434(7037), 1130–4. 117
Chang, D. E., Leung, S., Atkinson, M. R., Reifler, A., Forger, D., & Ninfa, A. J. 2009. Building biological memory by linking positive feedback loops. Proc Natl Acad Sci U S A. 105
Cherry, J. L., & Adler, F. R. 2000. How to make a biological switch. J Theor Biol, 203(2), 117–33. 103
Cohn, M., & Horibata, K. 1959. Inhibition by glucose of the induced synthesis of the beta-galactoside-enzyme system of Escherichia coli. Analysis of maintenance. J Bacteriol, 78, 601–12. 105
Del Vecchio, D., Ninfa, A. J., & Sontag, E. D. 2008. Modular cell biology : retroactivity and insulation. Mol Syst Biol,4, 161. 119
Elowitz, M. B., & Leibler, S. 2000. A synthetic oscillatory network of transcriptional regulators.
Nature, 403(6767), 335–8. 109
Gardner, T. S., Cantor, C. R., & Collins, J. J. 2000. Construction of a genetic toggle switch in Escherichia coli. Nature, 403(6767), 339–42. 103
Hartwell, L. H., Hopfield, J. J., Leibler, S., & Murray, A. W. 1999. From molecular to modular cell biology. Nature, 402(6761 Suppl), C47–52. 119
Jeong, H., Tombor, B., Albert, R., Oltvai, Z. N., & Barabasi, A. L. 2000. The large-scale organization of metabolic networks. Nature, 407(6804), 651–4. 112
Jeong, H., Mason, S. P., Barabasi, A. L., & Oltvai, Z. N. 2001. Lethality and centrality in protein networks. Nature, 411(6833), 41–2. 112
Kashtan, N., & Alon, U. 2005. Spontaneous evolution of modularity and network motifs. Proc Natl Acad Sci U S A,102(39), 13773–8. 119
Knabe, J. F., Nehaniv, C. L., & Schilstra, M. J. 2008. Do motifs reflect evolved function ?–No convergent evolution of genetic regulatory network subgraph topologies.Biosystems,94(1-2), 68–74. 117
Konagurthu, A. S., & Lesk, A. M. 2008. On the origin of distribution patterns of motifs in biological networks. BMC Syst Biol, 2, 73. 117
Kondo, T., Strayer, C. A., Kulkarni, R. D., Taylor, W., Ishiura, M., Golden, S. S., & Johnson, C. H. 1993. Circadian rhythms in prokaryotes : luciferase as a reporter of circadian gene expression in cyanobacteria. Proc Natl Acad Sci U S A,90(12), 5672–6. 111
Lima-Mendez, G., & van Helden, J. 2009. The powerful law of the power law and other myths in network biology. Mol Biosyst, 5(12), 1482–93. 113
Mangan, S., & Alon, U. 2003. Structure and function of the feed-forward loop network motif.
Proc Natl Acad Sci U S A,100(21), 11980–5. 116, 117
Mangan, S., Zaslaver, A., & Alon, U. 2003. The coherent feedforward loop serves as a sign-sensitive delay element in transcription networks. J Mol Biol, 334(2), 197–204. 116
Mihalcescu, I., Hsing, W., & Leibler, S. 2004. Resilient circadian oscillator revealed in individual cyanobacteria. Nature, 430(6995), 81–5. 111
Milo, R., Shen-Orr, S., Itzkovitz, S., Kashtan, N., Chklovskii, D., & Alon, U. 2002. Network motifs : simple building blocks of complex networks. Science,298(5594), 824–7. 114
Novick, A., & Weiner, M. 1957. Enzyme Induction as an All-or-None Phenomenon. Proc Natl Acad Sci U S A, 43(7), 553–66. 105
Ozbudak, E. M., Thattai, M., Lim, H. N., Shraiman, B. I., & Van Oudenaarden, A. 2004. Multistability in the lactose utilization network of Escherichia coli. Nature,427(6976), 737– 40. 105
Ravasz, E., Somera, A. L., Mongru, D. A., Oltvai, Z. N., & Barabasi, A. L. 2002. Hierarchical organization of modularity in metabolic networks. Science, 297(5586), 1551–5. 112
Robert, L., Paul, G., Chen, Y., Taddei, F., Baigl, D., & Lindner, A. B. 2011. Pre-dispositions and epigenetic inheritance in the Escherichia coli lactose operon bistable switch. Mol Syst Biol,6, 357. 105
Rosenfeld, N., Elowitz, M. B., & Alon, U. 2002. Negative autoregulation speeds the response times of transcription networks. J Mol Biol,323(5), 785–93. 116
Références bibliographiques
Sauro, H. M. 2008. Modularity defined. Mol Syst Biol, 4, 166. 119
Shen-Orr, S. S., Milo, R., Mangan, S., & Alon, U. 2002. Network motifs in the transcriptional regulation network of Escherichia coli. Nat Genet, 31(1), 64–8. 114
Stricker, J., Cookson, S., Bennett, M. R., Mather, W. H., Tsimring, L. S., & Hasty, J. 2008. A fast, robust and tunable synthetic gene oscillator. Nature,456(7221), 516–9. 110
Voigt, C. A., Wolf, D. M., & Arkin, A. P. 2005. The Bacillus subtilis sin operon : an evolvable network motif. Genetics,169(3), 1187–202. 117
Wagner, G. P., Pavlicev, M., & Cheverud, J. M. 2007. The road to modularity. Nat Rev Genet, 8(12), 921–31. 119
Wolf, D. M., & Arkin, A. P. 2003. Motifs, modules and games in bacteria. Curr Opin Microbiol, 6(2), 125–34. 119