• Aucun résultat trouvé

III. Analyse dynamique du réseau de régulation ComCDE

2. Utilisation des données de fusion transcriptionnelle

Les données de fusion transcriptionnelle seront utilisées pour paramétrer le modèle. En effet, les expérimentalistes de l’équipe « Transformation du pneumocoque » travaillent depuis des années avec des données de luminescence pour comprendre les mécanismes de régulation de la compétence (Prudhomme et Claverys, 2007). Ces données serviront à définir les paramètres du système d’équations différentielles ordinaires afin d’en étudier le comportement et le comparer aux données expérimentales. Cependant, les données brutes issues des mesures de luminescence reflètent la quantité de luciférase et non pas la quantité de la protéine d’intérêt. En effet, la demi-vie de la protéine d’intérêt et celle de la luciférase peuvent différer, et il en est de même pour les ARNm (Figure 18). Il est donc nécessaire de rechercher une méthode

mathématique afin de tirer bénéfice des données disponibles et les utiliser comme apprentissage des cinétiques des protéines régulant la compétence.

Figure 18. Représentation schématique de l’expression d’un gène rapporteur et d’un gène de l’hôte. Expression du gène comX et du gène codant pour la luciférase impliquant les

réactions de transcription, de traduction et de dégradation des produits de l’expression génique (modifié d’après de Jong et al., 2010).

Les données de luminescence et de fluorescence de gènes rapporteurs constituent des outils très populaires pour quantifier in vivo l’expression de gènes. Le principe de cette technologie est de fusionner la région promotrice, et parfois même une partie de la région codante d’un gène d’intérêt à un gène rapporteur (Figure 18). Le gène rapporteur est exprimé à partir d’un

plasmide ou peut être intégré au sein du chromosome hôte. Une bactérie portant la construction émet alors un signal lumineux qui est proportionnel à la quantité de protéine rapportrice dans la cellule. Ce signal de luminescence, ou de fluorescence, est mesurable et reflète ainsi le niveau d’expression du gène d’intérêt. Les données qui résultent de ces expériences sont utilisables, notamment dans le contexte de l’inférence ou de l’analyse de

réseaux de régulation dans les cellules bactériennes (Ronen et al., 2002, Berthoumieux et al., 2013, Stefan et al., 2015).

L’utilisation de fusions transcriptionnelles permet de mesurer l’expression de gènes à l’échelle de la population, mais aussi à l’échelle de la cellule unique. À l’échelle de la cellule unique, grâce à l’utilisation à la fois de la microscopie et de la fluorescence, il a notamment été démontré que la fluctuation de l’expression génique était due à la combinaison du bruit interne et du bruit externe du système étudié (Elowitz et al., 2002). En revanche, les lectures automatiques à partir de microplaques permettent, elles, la mesure de l’expression de gènes dans une population cellulaire plutôt que l’expression à l’échelle de cellules individuelles. Ce sont ces données qui sont à notre disposition. La résolution plus faible de ces données est cependant compensée par un débit plus élevé car plusieurs gènes peuvent être mesurés en parallèle, avec un ensemble de mesures obtenues dans le temps ce qui constitue un atout par rapport aux puces à ADN. De nombreux exemples de quantification de l’expression de gènes à l’échelle populationnelle sont retrouvés dans la littérature, associés à une approche de modélisation. Nous pouvons citer comme exemples l’étude du processus décisionnaire régulant l’entrée en phase lytique ou lysogène chez le phage lambda (Kobiler et al., 2005), l’étude du stress oxydatif (Lu et al., 2005) ou bien l’étude du système SOS en réponse à des dommages à l’ADN (Ronen et al., 2002).

Dans une expérience de microplaque, jusqu’à 96 cultures peuvent être suivies en parallèle, et cela sur plusieurs heures. Cela génère une quantité importante de données : afin de les interpréter de façon adéquate, il est nécessaire de comprendre les facteurs agissant sur ces mesures d’expressions de gènes. Une utilisation des données de fusion transcriptionnelles consiste à inférer les activités de promoteurs à partir des données brutes d’expressions de gènes rapporteurs. Des modèles mathématiques ont été développés pour inférer des quantités interprétables à partir des mesures brutes (Ronen et al., 2002, Finkenstädt et al., 2008, Huang et al., 2008, Wang et al., 2008, Aïchaoui et al., 2012). Ces méthodes permettent de reconstruire la concentration, relative, de l’ARNm rapporteur ainsi que la concentration de la protéine rapportrice à partir des données. Ces valeurs sont considérées comme une estimation de la cinétique d’expression du gène hôte correspondant. Toutefois, la cinétique de la protéine rapportrice et celle exprimée par le gène hôte peuvent différer, notamment en raison de la différence de demi-vies entre la protéine rapportice et la protéine hôte. Une méthode mathématique a été développée pour analyser et corriger ces biais (de Jong et al., 2010, Stefan et al., 2015). Cette méthode, présentée ci-dessous, a été utilisée dans le travail présenté ici.

Si A(t) correspond à la valeur d’absorbance corrigée de l’absorbance de fond au temps t, et que I(t) représente l’intensité brute mesurée de luminescence (en unité relative de luminescence RLU) au temps t, alors le ratio 𝑟(𝑡) = 𝐼(𝑡)/𝐴(𝑡)correspond à la quantité de luminescence moyenne par cellule au temps t. Le signal de luminescence peut alors être transformé en activité du promoteur en calculant sa dérivée selon la formule suivante :

𝑓(𝑡) = 𝑑 𝑑𝑡𝑟(𝑡) + (𝛾𝑟+ 𝜇(𝑡))𝑟(𝑡) = 𝑑 𝑑𝑡𝐼(𝑡) 𝐴(𝑡) + 𝛾𝑟 𝐼(𝑡) 𝐴(𝑡)

où r [min -1] est la constante de dégradation de la luciférase et où (t) [min -1] est la vitesse de

croissance de la population bactérienne. La relation entre la demi-vie et la constante de dégradation d’une protéine est donnée par t1/2 = ln2/r. Le temps de demi-vie de la luciférase utilisée dans les expériences a été estimé à 15 minutes (Prudhomme et Claverys, 2007), donnant r = 0,04621. L’activité du promoteur f(t) est exprimée en RLU min−1.

L’évolution au cours du temps de la protéine d’intérêt p(t) [RLU.min−1] a été calculée en

utilisant l’équation suivante établie par Stefan et collaborateurs (2015). Ce modèle opère une correction de la différence de demi-vies entre le reporteur luciférase et la protéine dont l’activité du gène est mesurée :

𝑑

𝑑𝑡𝑝(𝑡) = 𝑓(𝑡) − (𝛾𝑝+ 𝜇(𝑡)) 𝑝(𝑡), 𝑎𝑣𝑒𝑐 𝑝(0) = 𝛾𝑟 𝛾𝑝 𝑟(𝑡)

où 𝛾𝑝 [min−1] est la constante de dégradation de la protéine. À partir des résultats publiés et

par mesure de simplification, nous avons considéré seulement deux durées de vie différentes ; une pour ComD, ComE, DprA et ComAB qui a été estimée à 80 minutes (t1/2 = 55,45 min et

p = 0,0125) et l’autre pour ComX, ComW et SsbB qui a été estimée à 8 minutes (t1/2 = 5,45 min et p = 0,125) (Piotrowski et al., 2009 pour ComX et ComW ; Mirouze et al., 2013 pour DprA et SsbB ; Martin et al., 2013 pour ComE et ComD). La concentration initiale de protéines p(0) a été obtenue à partir de données de gènes rapporteurs à t = 0 et en supposant que l’expression des gènes impliqués dans l’état de compétence était à l’état d’équilibre au début de l’expérience.

Les équations ont été résolues par intégration numérique en utilisant la méthode Euler implémentée dans le package deSolve du logiciel R. Finalement, les cinétiques de protéines obtenues ont été normalisées par rapport à la concentration protéique maximale obtenue sur l’ensemble des jeux de données utilisés.