• Aucun résultat trouvé

4 Quelques conjectures nécessaires

Dans le document Réseaux de régulation chez Escherichia coli (Page 102-105)

Ce chapitre introduit l’utilisation d’un formalisme mathématique adapté pour modéliser la dynamique de fonctionnement d’un réseau de régulation génique en considérantle comportement moyen d’une population de cellules génétiquement identiques. Ce formalisme est basé sur la loi d’action des masses et nous permettra d’introduire l’utilisation des équations différentielles ordinaires (ODE). Cependant, avant de rentrer dans le vif du sujet, je souhaiterais aborder ce que ce formalisme ne modélisera pas. Autrement dit, je souhaiterais insister sur les hypothèses initiales (assumptions en anglais) sur lesquelles repose la suite. Que se passe-t-il donc « pour de vrai » dans une cellule que nos modèles ne montreront pas ?

4.1 Processus stochastiques basés sur des réactions chimiques

Ce chapitre décrit la modélisation ODE basée sur la loi d’action des masses. Ce formalisme est particulièrement bien adapté lorsqu’il s’agit de comparer les résultats issus de simulation avec ceux issus des expériences. En effet, la plupart des mesures des concentrations cellulaires

d’ARN ou de protéines sont effectuées à partir d’extraits issus d’un grand nombre de cellules (une population). Les résultats obtenus à partir de ces extraits représentent une moyenne ap-portant une information sur le comportement moyen d’une cellule. Or cette moyenne cache la variabilité qui existe entre les cellules. Cette variabilité intercellulaire est due aux déplacements aléatoires des molécules selon le mouvement brownien. Cela injecte des probabilités dans les phénomènes observés. Probabilités qu’il est nécessaire de prendre en compte si l’on veut décrire ce qui se passe dans une cellule unique mais que l’on peut ignorer si on regarde le phénomène à l’échelle de la population. Nous reviendrons plus tard sur les méthodes de modélisation sto-chastique de l’expression des gènes. Cependant rappelons brièvement ici que la fréquence des collisions est fonction de la concentration des molécules et de leurs vitesses. Parmi toutes les collisions, seule une partie des molécules ont une énergie suffisante et la bonne orientation au moment de l’impact pour rompre les liaisons existantes et en former de nouvelles. L’énergie thermique minimale pour dépasser la barrière de transition permettant à la réaction chimique de se produire s’appelle l’énergie d’activation. Une des caractéristiques importantes de la bio-chimie cellulaire c’est que cette barrière d’énergie n’est pas suffisamment haute pour empêcher les changements aléatoires d’état aux températures physiologiques. Ceci signifie que la plupart des interactions protéines–protéines et ADN–protéines sont constamment en train de se former puis de se dissocier.

4.2 Homogénéité du milieu, diffusion et encombrement

Dans les modèles ODE que nous allons étudier, nous allons parler de concentration de protéines. Ces concentrations seront toujours considérées comme homogènes dans la cellule

E. coli. Nous ne modéliserons pas l’espace et il n’y aura donc pas de gradient spatial. Bien que, contrairement aux cellules eucaryotes, il n’y ait pas de compartiments chez E. coli, cela n’empêche pas l’existence de ces gradient spatiaux (Llopis et al.,2011). De plus, l’espace dans la cellule est extrêmement encombré ce qui réduit significativement les taux de diffusion des protéines et des complexes macromoléculaires (Zhou et al., 2008; Elowitz et al., 1999). Une des conséquences directe est la ségrégation des molécules qui ont une affinité les unes pour les autres ce qui crée des concentrations locales plus fortes. Pour l’interaction ADN–protéine, il a été montré que l’effet de l’encombrement peut augmenter l’activité de la liaison ADN–protéine par plus d’un ordre de grandeur (Poon et al.,1997).

IV.4 Quelques conjectures nécessaires

4.3 Recherche du site de liaison sur l’ADN par le facteur de

trans-cription

On sait depuis les années 70 que les facteurs de transcription trouvent leur site de liaison beaucoup plus vite que ce qui serait attendu avec une diffusion simple en 3 dimensions (Riggs

et al., 1970). L’hypothèse actuelle propose une recherche avec deux types de diffusion (von Hippel & Berg, 1989). Le facteur de transcription recherche sa cible (son site de liaison) par glissement le long d’un court segment d’ADN (100pb). Cela représente une diffusion facilitée à 1 dimension. Puis le facteur de transcription se dissocie, diffuse dans le cytoplasme (en 3 dimensions) avant de se lier à une nouvelle région d’ADN sur lequel il glisse à nouveau. La protéine ne restant sur l’ADN que quelques millisecondes, ce processus peut être itéré un grand nombre de fois jusqu’à ce qu’elle trouve enfin sa cible (en moins de 5 minutes) (Elf et al.,2007;

Li & Elf, 2009). Selon ce modèle de recherche, il est possible que notre vision binaire de la liaison ADN–protéine (faible–forte /spécifique–aspécifique) soit fausse et qu’il soit plus réaliste de penser en terme de « gaussienne » des distributions d’affinité des sites de liaison pour un facteur de transcription donné (Slutsky & Mirny,2004).

4.4 Transcription et traduction

Dans les modèles que nous allons décrire, la machinerie globale (ARN polymérase, ribo-somes) et l’énergie (ATP, pouvoir réducteur) seront toujours considérés en excès et donc non limitants. De plus, le délai de transcription–traduction–repliement qui existe entre la fixation du facteur de transcription activateur et l’arrivée des premières protéines fonctionnelles ne sera pas pris en compte.

4.5 Approximation pour les réactions rapides

Les régulations allostériques (fixation de l’IPTG sur le répresseur LacI par exemple), mo-difications post traductionnelles (phosphorylation, acétylation..) et les réactions métaboliques s’effectuent à une vitesse très rapide (millisecondes, secondes). Par conséquent, elles sont consi-dérées « à l’équilibre » par rapport aux régulations géniques (minutes, heures). Autrement dit, l’ajout d’IPTG en concentration suffisante dans le milieu change instantanément l’affinité de LacI pour l’ADN par rapport à l’arrivée de la β-galactosidases. Il n’est donc pas nécessaire de modéliser explicitement l’import de l’IPTG et la formation du complexe [lacI.IPTG] en fonction du temps.

4.6 Intégration des signaux au niveau des promoteurs complexes

Nos modèles représentent toujours des cas simples avec soit 1, soit 2 facteurs de trans-criptions régulant l’activité d’un même promoteur. Lorsque ces deux facteurs sont présents en même temps, on utilise la logique booléenne classique (fonction AND ou OR par exemple) pour intégrer le signal résultant. Mais comment intégrer les signaux issus de promoteurs plus complexes comme le promoteur aceBAK ci-dessous ? Quelle allure a la fonction de sortie qui décrit l’activité d’un promoteur complexe en fonction de ses « entrées » protéiques ? On touche ici à deux limitations :

une limitation expérimentale : aucune méthode n’est en mesure actuellement de fournir une résolution suffisante pour nous aider à déterminer cette fonction.

une limitation relative au formalisme de modélisation : de mon point de vue, seul un modèle spatial à l’échelle de l’atome et de la liaison chimique peut fournir la fonction qui décrit l’activité d’un promoteur complexe en fonction de ses « entrée » protéiques.

Figure IV.2La régulation très complexe de l’operon aceBAK (image Ecocyc)

4.7 La topologie du réseau est dynamique

Dans les modèles que nous allons voir, la topologie sera considérée comme statique. En réalité, la topologie est dynamique et devrait, dans l’absolu, être modélisée comme une variable. Par exemple, les variations de super-enroulement (qu’on appelle aussi topologie mais qui n’a rien à voir avec la topologie dont je parle ici) de l’ADN peuvent supprimer l’affinité d’une protéine pour un site sur l’ADN ce qui supprime l’existence de cette interaction.

Dans le document Réseaux de régulation chez Escherichia coli (Page 102-105)