• Aucun résultat trouvé

Chapitre II : Expression génétique et sa régulation par l’ARN chez les entérobactéries

C. Régulation post-transcriptionnelle par les ARN

1. Séquences, RBS atypiques et rôles de la protéine ribosomique S1

Comme évoqué précédemment, la capacité du ribosome à démarrer correctement la traduction dépend en grande partie du RBS de l’ARNm, et notamment de l’appariement entre séquences SD et anti-SD. Toutefois, plusieurs autres séquences et régions de l’ARNm ont été caractérisées pour leur importance pour l’expression génétique, notamment parce qu’elles ont un effet positif sur le démarrage de la traduction en comparaison à des ARNm dépourvus de ces séquences. S’il ne s’agit pas de régulation à proprement parler, il est tout à fait envisageable (et parfois même observé) que ces séquences et RBS atypiques soient l’objet de régulations spécifiques, c’est pourquoi leurs particularités seront abordées ici.

a. Séquences « enhancer » et site de fixation de la protéine S1

La séquence epsilon a été identifiée pour la première fois au sein du gène 10 du coliphage T7. On y trouve, ainsi que dans de nombreux autres gènes de ce phage, une séquence riche en nt A-U directement en amont du SD, activant d’un facteur 100 la synthèse protéique quand elle est positionnée devant un gène rapporteur lacZ (Olins and Rangwala, 1989). A l’origine les auteurs supposaient que cette séquence epsilon permettait une interaction ARNm-ARNr similaire à celle observée avec la séquence SD du fait d’une complémentarité de séquence avec une partie de la région 437-497 de l’ARNr 16S (Fig. 12.A tige-boucle « H17 »). Il a cependant été démontré depuis que l’activation de la traduction était indépendante de l’appariement prédit (O’Connor and Dahlberg, 2001).

52 Parallèlement, des séquences poly-U en amont du SD de gènes du coliphage Qβ, assimilables aux séquences epsilon, ont été caractérisées en tant que sites de fixation de la protéine ribosomique S1 (Boni et al., 1991). Par la suite, cette interaction entre la protéine S1 et une région de 11 nt en amont du SD, souvent riche en nt A-U, s’est révélée être un phénomène communément retrouvé pour les ARNm bactériens (Hook-Barnard et al., 2007; Nafissi et al., 2012; Sengupta et al., 2001) (Fig. 18). La disponibilité de la protéine S1 permet donc la régulation epsilon-dépendante de multiples ARNm chez les bactéries.

Une considération importante concerne l’hypothèse que plus la séquence SD de l’ARNm est proche de la séquence consensus complémentaire à l’anti-SD, plus efficace serait la synthèse protéique. Ce serait ignorer qu’après la fixation du ribosome, celui-ci doit être en mesure de se défaire de cet appariement afin de procéder à l’allongement de la traduction. Il semblerait ainsi que le site de fixation de la protéine S1 joue ici un rôle d’ « enhancer » – ou accélérateur – de la traduction. En effet, l’interaction entre S1 et cette séquence epsilon déstabiliserait l’interaction SD/anti-SD pour permettre un allongement de la traduction plus efficace (Komarova et al., 2002; Takahashi et al., 2013).

Figure 18 – Les diverses régions d’un RBS bactérien

Représentation schématique d’un ARNm en noir, et des différentes régions du RBS permettant le démarrage de la traduction en vert. Les différentes protéines et ARN interagissant avec ces régions du RBS sont représentées en complexe avec la sous-unité 30S du ribosome (en bleu), avec les protéines ribosomiques (en jaune), l’ARNr 16S (en vert pâle) et l’ARNt de démarrage (multicolore). Ces interactions sont représentées par des flèches bleues, pointillées quand elles sont hypothétiques. Les longueurs et positions des séquences epsilon et DB sont ici inspirées de (Sprengart et al., 1996).

Une autre séquence au rôle d’« enhancer » similaire à celui des séquences epsilon, dite séquence « downstream box » (DB) et située en aval du codon de démarrage de la traduction (Fig. 18), a été identifiée dans le gène 0.3 du coliphage T7 (Sprengart et al., 1990).

53 Ce gène contient l’un des RBS les plus forts trouvés chez E. coli et ses phages, permettant de parasiter efficacement la machinerie traductionnelle d’E. coli. À l’instar de ce qui a été proposé pour la séquence epsilon, les auteurs ont suggéré que cette séquence située entre 15 et 26 nt en aval du codon de démarrage pouvait s’apparier aux nt 1469 à 1483 de l’ARNr 16S, avant que cette hypothèse ne soit infirmée par une autre équipe (O’Connor et al., 1999). A ce jour le mécanisme impliqué n’est pas connu, et une interaction avec la protéine S1 est certainement exclue du fait de la position de la séquence DB en aval du codon de démarrage. On peut cependant supposer qu’une autre protéine ribosomique connue pour son interaction avec l’ARNm puisse être impliquée ici. Cela pourrait être le cas de la protéine S2 dont un mutant a déjà été associée à l’activation traductionnelle par la séquence DB du gène cI chez le prophage lambda (Shean and Gottesman, 1992), et qui pourrait établir un contact avec cette région de l’ARNm (La Teana et al., 1995) (Fig. 12.A, Fig. 18).

b. RBS atypiques

La sous-unité 30S du ribosome doit être à même de reconnaître le RBS d’un ARNm pour s’y fixer. Cependant il existe des ARNm portant un RBS atypique, où il semble manquer certains éléments – or si la synthèse protéique à partir de ces ARNm peut être affectée, elle reste généralement possible et parfois même efficace. Ces cas particuliers seront abordés ici.

Il existe ainsi de nombreux exemples d’ARNm curieusement dépourvus de séquence SD canonique : c’est le cas de plus de 15% des gènes chez les gamma-protéobactéries dont font partie les entérobactéries (Omotajo et al., 2015). Etonnamment, la seule condition qui semble nécessaire à l’expression normale de ces gènes semble être l’absence de structure au niveau du codon de démarrage de la traduction (Scharff et al., 2011). Dans d’autres cas, ce sont les séquences epsilon (Nafissi et al., 2012) et DB (Sprengart et al., 1996) qui peuvent pallier l’absence de séquence SD. Il a aussi été démontré qu’un RBS modulaire pouvait parfois être formé par une combinaison de structures de l’ARNm, réunissant des morceaux de séquences SD éparses dans la région 5’UTR de l’ARNm avec le codon de démarrage de la traduction. C’est ce qui est observé pour le gène rpsA, codant la protéine ribosomique S1 (Boni et al., 2001; Skorski et al., 2006). L’une des particularités intéressantes de ce système est que la protéine S1 elle-même peut se fixer à son propre ARNm quand elle est en excès dans la cellule, provoquant un changement de structure de l’ARNm qui prévient la formation de ce

54 RBS modulaire. De cette manière, la protéine S1 exerce un rétrocontrôle négatif sur sa propre synthèse.

Il existe un cas encore plus extrême de RBS atypique, avec les ARNm que l’on appelle « leaderless » ou sans 5’UTR. Ces derniers peuvent notamment être produits par la toxine MazF, une endoribonucléase clivant les ARNm en 3’ de séquences ACA (Vesper et al., 2011) et souvent à proximité du codon de démarrage, les séparant de ce fait de leurs séquences SD tout comme d’éventuelles séquences epsilon. De manière surprenante, les auteurs de cette étude ont démontré que MazF catalyse également un clivage à l’extrémité 3’ des ARNr 16S les privant de séquence anti-SD, et concluent que la population de sous-unité 30S ainsi générée est capable de démarrer spécifiquement la traduction des ARNm sans 5’UTR. Cela permettrait à la cellule de largement et rapidement modifier son profil de synthèse protéique – ou protéome – dans les conditions où MazF est exprimée (Sauert et al., 2016).

c. Fréquence et rôles des codons

Comme expliqué dans la partie Introduction I.B.1.c, il existe une forte redondance du code génétique ainsi qu’un grand nombre d’ARNt, plusieurs pouvant décoder le même codon. Or il existe une corrélation forte entre l’abondance des différents ARNt et la fréquence des codons qu’ils reconnaissent (Ikemura, 1981). Certains codons sont ainsi appelés codons rares car ils sont peu utilisés à travers le génome d’une espèce donnée. Ils peuvent avoir un impact important sur l’expression des gènes qui en contiennent dans la mesure où peu d’ARNt sont disponibles pour les décoder (Konigsberg and Godson, 1983).

Plus généralement, il est aujourd’hui admis qu’un biais dans l’usage de codons, qu’il soit dans l’usage de codons rares ou par exemple dans la répétition du même codon plusieurs fois d’affilée, peut contribuer à moduler l’expression génétique en imposant au ribosome des pauses (Quax et al., 2015) voire des glissements du cadre de lecture (Kim and Tinoco, 2016). Il a ainsi été établi récemment que la nature des codons d’une ORF a une influence plus forte sur le niveau d’expression des protéines que la formation de structures secondaires, à l’exception notable des 16 premiers codons, c’est-à-dire au niveau du démarrage de la traduction (Boël et al., 2016). Néanmoins, diverses structures secondaires d’ARNm peuvent

55 avoir une influence au niveau post-transcriptionnel. Certaines sont justement abordées dans le sous-chapitre suivant.