• Aucun résultat trouvé

Conclusions & Perspectives

Dans le document en fr (Page 190-198)

Mes travaux de thèse ont été consacrés à l’étude de la terminaison de la transcription Rho- dépendante, un mécanisme de régulation majeur et spécifique aux bactéries. J’ai utilisé essentiellement des approches biochimiques, complétées d’analyses bio-informatiques réalisées dans l’équipe par le Dr. Eric Eveno, pour tenter de mieux cerner les éléments de séquence ADN (ou ARN) qui, au sein du génome (ou transcriptome) gouvernent l’action du facteur Rho. Nos résultats confirment qu’il n’existe probablement pas de séquence ADN (ou ARN) consensus « simple » caractérisant les terminateurs Rho-dépendants. Néanmoins, nous avons pu mettre en évidence un ensemble de « descripteurs » de séquence qui, pris collectivement, permettent de prédire la propension d’une séquence ADN à induire la terminaison Rho-dépendante. Cette capacité prédictive du groupe de descripteurs a été mise à l’épreuve à grande échelle pour rechercher les zones potentiellement favorables à la terminaison Rho-dépendante au sein des génomes d’E. coli MG1655 et de Salmonella LT2. Les résultats obtenus mettent en lumière une grande proportion de ces zones favorables à l’action de Rho à l’échelle génomique (Figure 63). Ainsi, nos données confortent l’idée que les terminateurs Rho-dépendants sont construits à partir de règles suffisamment laxes pour autoriser l’intervention de Rho à de très nombreux points du génome, probablement sous le contrôle d’autres facteurs (découplage transcription-traduction, CET en mode « arrêt », formation d’une structure « R-loop », repliements alternatifs du transcrit, etc.).

Figure 63 : Répartition des prédictions de terminaison Rho-dépendante par catégories. Les

quantités respectives de régions pour lesquelles la terminaison est prédite « forte », « faible », « nulle » ou ne peut être prédite correctement (« hors modèle ») (Nadiras et al., 2018a) sont indiquées.

Notre modèle fournit des prédictions crédibles pour environ 65 % du génome d’E. coli ou de Salmonella mais n’est pas compatible avec les séquences contenues dans la fraction restante (35 %) (Nadiras et al., 2018a). Cette incompatibilité est probablement liée à la taille de l’échantillon de matrices ADN caractérisées expérimentalement et utilisées pour bâtir le modèle (104 « training » matrices) qui reste trop réduite pour représenter exhaustivement toutes les séquences génomiques possibles. Cette faiblesse du modèle pourrait sans doute être corrigée par la caractérisation et l’inclusion de nouvelles séquences ADN choisies au sein des régions « hors-modèle »

(Figure 63). Cette tâche pourrait être facilitée et accélérée par l’utilisation de l’essai

fluorogénique de terminaison que j’ai développé (Section 121). De cette manière, on peut espérer augmenter le pouvoir de prédiction du modèle et offrir une cartographie plus complète pour des études d’ontologie. Ce genre d’étude pourrait, à son tour, permettre de déterminer si certaines catégories de fonctions (ou niveaux d’expression de gènes/opérons) sont plus particulièrement associées (ou non) à la terminaison Rho-dépendante.

Une analyse ontologique des régions prédites par notre modèle (Figure 63) pourrait peut-être également faciliter l’identification de nouveaux mécanismes/circuits de régulation conditionnelle impliquant le facteur Rho. Au cours de ma thèse, je me suis concentré sur les régions 5’UTR pour rechercher et tester des candidats sujets à une telle régulation (Tableau 4), une démarche qui a également été suivie par d’autres équipes (Bastet et al., 2017;

Brandis et al., 2016; Chauvier et al., 2017; Gall et al., 2018; Kriner and Groisman, 2015; Sedlyarova et al., 2017; Sevostyanova and Groisman, 2015). Néanmoins, une étude récente a identifié un mécanisme de ce type dans une région intergénique de l’opéron galIETKM (Wang et al., 2015), suggérant que la régulation conditionnelle Rho-dépendante reste largement sous-estimée. Dans ce contexte, notre nouvel essai fluorogénique pourrait également se montrer utile comme outil de première intention pour sonder de nouvelles séquences génomiques.

Parmi les candidats sujets à régulation conditionnelle que j’ai testés au cours de ma thèse (Tableau 4), le cas de la région 5’UTR du gène rpoS est sans doute le plus emblématique. Le gène rpoS encode le facteur sigma alternatif S, un facteur général de réponse au stress soumis à une régulation complexe et multifactorielle (Figure 64).

Figure 63 : Diagramme résumant la régulation complexe du gène rpoS d’E. coli. Extrait de la base de données

En découvrant un terminateur Rho-dépendant dans la région 5’UTR de rpoS, qui peut être inactivé par les sRNA ArcZ, DsrA, RprA, une équipe concurrente (Sedlyarova et al., 2016) et la nôtre (Nadiras et al., 2018b) ont révélé une couche supplémentaire de complexité pour ce système hautement régulé. L’analyse des autres candidats potentiels (Tableau 4) n’a

malheureusement pas révélé d’éléments de régulation conditionnelle aussi marquants. Le cas de la région 5’UTR de cspA reste néanmoins intriguant. Mes données suggèrent que cette région contient un terminateur Rho-dépendant faible qui peut être stimulé par NusG (Figure 62 et texte page 177). L’activité de ce terminateur est diminuée in vitro lorsque la température d’incubation est abaissée à 20°C (Figure 62). Bien que de nombreux tests de vérification in vitro et in vivo restent à faire, ces données préliminaires suggèrent que Rho pourrait être impliqué dans le mécanisme de régulation de l’expression de cspA en réponse à un « choc froid » (Figure 65).

Figure 65 : Mécanisme possible impliquant Rho dans la régulation de cspA en fonction de la température. La

séquence « cold box » est indiquée par l’étoile bleue ( ) et la protéine CspA représentée par un triangle violet ( ). Figure inspirée de (Guijarro et al., 2015).

L’adaptation de la stratégie Clip-seq à l’étude de Rho pourrait peut-être également permettre d’identifier de nouveaux terminateurs Rho-dépendants et sites potentiels de régulation conditionnelle. De plus, cette méthode permettrait de mieux localiser les terminateurs et sites Rut au sein des génomes car, à l’inverse de l’approche RNAseq utilisée jusqu’à présent pour caractériser les transcriptomes Rho-dépendants (Holmqvist et al., 2016) elle n’est pas sensible aux modifications post-transcriptionnelles des transcrits par les exonucléases. Bien qu’inspirées de protocoles ayant fait leur preuve (Holmqvist et al., 2018; Holmqvist et al., 2016; Potts et al., 2017), mes tentatives d’adaptation de l’approche Clip-seq à l’étude de Rho chez Salmonella (page 140) se sont heurtées à deux problèmes majeurs que

je n’ai pu résoudre dans la durée de ma thèse : D’une part, les ARN récupérés étaient relativement de petites tailles (≈25 nt) (Figure 56C), suggérant une activité « nucléase » anormalement élevée dans les souches utilisées et/ou mal contrôlée lors des étapes de lyse et d’immunoprécipitation. D’autre part, la quantité d’ARN récupérée après immunoprécipitation et purification par PAGE et transfert sur membrane s’est avérée beaucoup plus faible (~3 ng/échantillon) que recommandée pour la préparation des banques d’ADNc pour le séquençage NGS (> 20 ng). Ceci contribue vraisemblablement à expliquer pourquoi les résultats du séquençage indiquent une contamination de type « microbiome » des échantillons. Ces éléments démontrent que de nombreux efforts d’optimisation restent à faire pour adapter convenablement l’approche Clip-seq à l’étude de Rho. Une piste possible est l’utilisation d’une variante sophistiquée appelée iCLIP-seq (Individual-nucleotide

resolution UV crosslinking and immunoprecipitation coupled to high-throughput sequencing)

(Huppertz et al., 2014) qui limite la perte de matériel lors de la préparation des banques d’ADNc. Cette perte est notamment due à la faible efficacité des transcriptases inverses à synthétiser le brin ADNc au-delà du site de photo-pontage. Ce problème est résolu en partie dans la variante iCLIP-seq par l’introduction du segment « adapteur » amont requis pour le séquençage après l’étape de transcription inverse (plutôt qu’avant cette étape dans le protocole classique) grâce à une étape de circularisation/clivage (Figure 66).

Pour finir, je voudrais souligner que mes travaux ont porté sur l’étude de la terminaison Rho-dépendante chez E. coli et Salmonella et que leur transposition au reste du règne bactérien devrait être menée avec prudence. Ainsi, si notre modèle de prédiction est probablement utilisable pour explorer le génome de bactéries proches (ƴ-Protéobactéries) et/ou contenant une machinerie de transcription et un facteur Rho similaires (D'Heygere et al., 2013), il n’est probablement pas valide dans les autres cas. Néanmoins, il est probable qu’une stratégie similaire de modélisation de la terminaison Rho-dépendante puisse être menée chez ces espèces philodivergentes, à condition que leur machinerie de transcription (Rho compris) soit purifiable et utilisable in vitro pour bâtir une base de données expérimentale fiable. Ce travail de longue haleine permettrait d’apprécier les différentes formes et fonctions assumées par la régulation Rho-dépendante au travers de l’ensemble du règne bactérien.

Dans le document en fr (Page 190-198)