Fig.2.2 – Structure des deux sous-unit´es ribosomales reli´ees. `A gauche, la sous-unit´e 30S, et `a droite, la sous-unit´e 50S. Au centre en jaune, un ARNt imbriqu´e dans la structure.
2.2.2 Ribosome
Le ribosome est le cœur de la traduction. C’est une ribonucl´eoprot´eine, ensemble de mol´ecules complexes form´ee de deux sous-unit´es. Chacune est compos´ee d’environ deux-tiers d’ARN pour un tiers de prot´eines, en masse. Ceci en fait une grosse mol´ecule, de 200 ˚A de diam`etre environ. `A eux seuls, les 20 000 ribosomes pr´esents chez E. coli p`esent le quart du poids total de la cellule. Le ribosome bact´erien est appel´e ribosome 70S. Cette d´enomination lui vient de son coefficient de s´edimentation, premi`ere mesure avec laquelle il a ´et´e identifi´e. Les deux sous-unit´es sont de tailles in´egales : la grande sous-unit´e est appel´ee 50S, et la petite sous-unit´e, 30S (Fig. 2.2). La structure exacte du ribosome est connue depuis 1968, et le ribosome est l’une des premi`eres mol´ecules complexes dont on ait la structure compl`ete. La grande sous-unit´e ribosomale se compose de deux mol´ecules d’ARN, les ARN 23S et 5S, et de 34 prot´eines, dont 32 diff´erentes. La petite est form´ee d’un seul ARN, dit 16S, et de 21 prot´eines diff´erentes. Les trois ARN proviennent du mˆeme transcrit, qui est cliv´e et modifi´e post-transcriptionnellement. Une remarquable propri´et´e est que ces ARN sont truff´es de courtes s´equences compl´ementaires, et donc sont tous les trois partiellement repli´es de fa¸con extrˆemement pr´ecise et conserv´ee (Fig. 2.3). Cet agencement permet `a certaines s´equences, que l’on suppose fonctionnelles, d’ˆetre non appari´ees et accessibles depuis l’ext´erieur du ribosome. En particulier, trois sites fonctionnels sont pr´esents sur le ribosome, appel´es sites A, P et E. Ces sites sont des emplacements `a l’int´erieur du ribosome, dans lesquels les ARN de transfert vont passer successivement au cours de la traduction. Les ARNt peuvent transiter d’un site `a l’autre grˆace `a des changements de conformation du ribosome et `a des r´eactions biochimiques
42 CHAPITRE 2. LE SYST `EME DE TRADUCTION BACT ´ERIEN
AA AU UG AA G C
A U
G C
U G
U G
U GACAU U GA C
A U
U A
U A
G A U
A U
C G
G C
C G
U A GG C
C G
G C
G C
C G
A U
G C
G C
C G
C UA CA G A U C G UA A G C C G A AG
C U G C G GAA U C G G
A G
C U A A AC
G A U G C G U A U A U G C A U A U G C CUU G G G
GG CA GG C G
U A G
C A
GU AA GU U U A C G U A G C G C G
C A
GU AA G CU CG G C
U G G C A U U A G C G C A G
C G
G G C G C G
A A U AA
C C G U A A U C G U G G C GA AA AU UA AU AA GC C U A C GAACG AC AAG U A U G C G U G C G C
AG C G C G UU
CG G
AU G C
G C
G C
UA U U
GA C
C G
U G
GA U A
A U
G C
G C
U A
G C
G U
G C
UG AA CGG
AC G AG UAG
C C G U A G C G U
U A
C G
U G G GAA
GA C CA G U A G C G C A U
A G
UC AG AG CACG
AC G U
A C
G C
G AUC G GCA
G G AA UA U A
GU C C G A U
AC AU G G U G C G C C G CG
AA A G
A UG G C U A A U U G
AG A AG GA U G U C G C G UU
CG GU A A A U UAG U C A A G GCA C G G G C G C
C AG GGC AA GG G A C G U U C A G A U A U G U U C UAA U AC
A UUG AGUU
A
AAG CGCACC GUGG CG UA A CCCAUCCGGGC m7GAG CGAGGCAUC
C GG
AU A
A GG AAU Y
U UCGAAACAU G GUGGC CCG G
C C
G A
U C
G G AC G U G
C C
G G G C U G U A U A G C U G U G
AA U G C U A C G A U G C A U U A G C U G G U
AA UA CC G C G C G G U G C G C UC
CA A A A C U A UU G
C A U G C U A C G U A C G G C U A
A G
GAAGGGGGGU UCCCCCGG U G A
A A
A G U G U A C G C G A U G C G U U A UG GA C C G G U UG GAA A GU A GA
G A C C GG
G U GG
C C G GA GA
A
AG
C AG GAA AAGGCUAAAAUAGCGUGGGCAGGG ACGCACCUGGUCCU CA
GU A
C GU AA
AC AG GU
C U A C G G C A U C G U A U G
C G
C A
U G
U G
C U
G U
G G
U U
G G
C C
G C
G C U U
AG
GGA G C C
G U AA C UG AU C UG
C G U G C
GAGUA CG
U G U C G C G GC AA AA AA AA
A
1000
20 540
560
860
94 9 970
9
30 10 550
40 400
360 50
60 70
90 80
100
110
120
230 130
140 150
160
180 170
190 200 210
220 270 250
260 280
290 310
300 320 330
350
340 370 390
380 420 410
430440 490 460
470
480
510
520 530
450
500
240
570 580 650
590 640
600 610 620
630
750 660
740 680 670
710
690
700 720
730
760 770 810
780 790
800
820 830
840
880 870
910 890
900
1400
1410 1490
1420 1480
1430 1470
1440 1460
1450 920
1390 930
0 1340
950 1230
60 80
1220 990 1040 1020
1010 1030
1210 1050 1060 1070 1080 1090
1100 1110
1120
1150 1130
1140
1160
1170 1190 1180
1200
1240 1290 1250
1260
1270
1280
1300
1330 1310
1320 1350
1360 850
G
1530 1520
1540 1510
m2G
A U U A G C A U C G G U GG
U G C G C C G C G C G G C CA
U C G A A
U G
C C
G G
C G
U U
A G GUAGCAGUUGUG UCGUGCACCAA AU UA A
U A
C G
G C
UA AACG
GAACC U U AUCCUGGUC GGACCAG GU CAA U C C A C G
G A C U G G G C
C A GA U U A U A U G U A C G A U AG
GA G UGCCUU CGAGGA A
A U G C G C UGCUG CGU CA UAUCGGCUGCGU ACUGACGCAU G C C G U A C G G C U A G U U A U A UG GA
UGUUGGGUA AGGCCC U
AC GCA AC C G C G U G U G A U U A C G C G U A U A U A G C U U
A G
A C G C G A GC
G G C G C U CGC C G GAC U
GU G CC G A
U G C U A G
UA AA GA AGAGG UA G
A CA U
UA C
GC U A
C A A U G C G
U C
G G
C C
G A
U U
G ACA A A G
C A
U G
C A AG
C C
G GAC C
G U
A C
G G CG
A AC GA AG C UA AA A
GU GA CU G C
G
A G
A A
G U
UA U C GG C A U G C U A C
G U
CG A CA UC CU GG A
AGU AA U U
G C G G
C U A G C G
C A
G U
AC AG UA AG UA AC CU A C
m5C
GA
m2G
5' C
3' M
3' m
G m6Am6A2
2 C
CA CC G A CC G G C CU
A G
A U C G C G
A G
U G G U G C
G A
A G
G U U A G C G U G U U A U G G U C G A U A U A U GA AA G C
U A A U G U G C U G G C C G U G U G AA C G C G UU CG A CA C AAG U A
m5C m4Cmm3U
A A A G
GU
G A U A U C G C G G C U G A U G C G G C AU CA CC UC CU UA
m2
1 2
3 4
5 6
7
8
9 10
11 12
13 14 15 16
17 18
19 21 20
22 23
24
25 26
27 28
29 30 31
32 33
34 35 36
37
38
39 40
41
42 43
44
45
E s c h e r i c h i a c o l i
small subunit ribosomal RNA
Fig. 2.3 – Sch´ema d’un ARN ribosomal 16S d’E. coli. On remarque la complexit´e des s´equences et le grand nombre de bases appari´ees.
2.2. LES MOL ´ECULES IMPLIQU ´EES DANS LA TRADUCTION 43 tr`es fines, dont certaines sont provoqu´ees par des mol´ecules ext´erieures, comme EF-G ou LepA (Qin et al., 2006). Finalement, le centre actif du ribosome a une activit´e catalytique peptidyl-transf´erase, permettant de cr´eer une liaison peptidique entre deux acides amin´es.
Les g`enes codant pour des prot´eines et ARN ribosomaux sont tr`es souvent regroup´es en op´erons, dits op´erons ribosomaux (Guy and Roten, 2004). Ces g`enes essentiels sont souvent proches de l’origine de r´eplication chez la bact´erie, en une ou plusieurs copies.
L’int´erˆet d’un tel emplacement r´eside dans le fait que cette partie du chromosome est copi´ee en premier lors de la r´eplication, d´emultipliant le nombre de copies effectives que l’organisme poss`ede de ces g`enes et influant sur le dosage g´enique. Cet effet peut ˆetre tr`es important dans le cas d’une croissance sur milieu riche : dans cette situation on estime que 3 fourches de r´eplication se suivent sur le chromosome d’E. coli, augmentant d’autant le nombre de copies des g`enes localis´es proches de l’origine de r´eplication. Les prot´eines et les ARN ribosomaux sont tr`es conserv´es au cours de l’´evolution, et on les retrouve chez toutes les esp`eces. Ceci est particuli`erement vrai pour les g`enes codant pour les ARN 16S,
`
a cause des contraintes structurelles que doivent respecter ces ARN. C’est d’ailleurs sur la base de s´equences d’ARN 16S qu’ont ´et´e effectu´ees les premi`eres analyses phylog´en´etiques
`
a grande ´echelle. Ces analyses peuvent en effet s’´etendre aux eucaryotes, qui poss`edent un ARN 18S homologue `a l’ARN 16S.
2.2.3 ARN de transfert
Les ARN de transfert (ARNt) sont des acides ribonucl´eiques longs de 73 `a 93 bases.
Une de leurs particularit´es est que, en plus des ribonucl´eotides classiques (A, U, C et G), leur forme finale contient de tr`es nombreuses bases modifi´ees. Les modifications peuvent ˆetre assez simples, comme une m´ethylation ou une dim´ethylation (de telles modifications sont aussi observ´ees sur d’autres ARN), mais peuvent aller jusqu’a l’emploi de bases compl`etement diff´erentes de celles trouv´ees classiquement dans les ARN. Un remplace-ment des plus courants est celui de l’ad´enine A par l’inosine I. En tout, plus de 60 types de modifications diff´erentes sont recens´ees. Ces modifications, aussi bien les changements l´egers sur une base que son remplacement, sont le r´esultat de l’action d’une gamme d’en-zymes tr`es sp´ecifiques. En effet, contrairement `a l’ARNm, les ARNt sont modifi´es de fa¸con intense apr`es la transcription de la s´equence d’ARN primaire. En plus des modifications au niveau des bases, l’ARN produit lors de la transcription est cliv´e `a la fois en 5’ et en 3’, puis li´e `a une s´equence CCA en 3’. Finalement, `a cause de sa s´equence particuli`ere, contenant de courtes parties compl´ementaires, l’ARNt se replie en forme dite de “feuille de tr`efle”, compos´ee d’une tige et de trois boucles (Fig. 2.4 et 2.5). Alors seulement l’ARNt est fonctionnel et stable.
Dans sa forme repli´ee, qui est celle observ´ee in vivo, la moiti´e environ des bases sont appari´ees. De plus, chez les Archaea, des bases conserv´ees suppl´ementaires ont ´et´e iden-tifi´ees (Mallick et al., 2005). Les bases non appari´ees se trouvent majoritairement dans les trois boucles, et beaucoup d’entre elles sont un rˆole fonctionnel au cours des interac-tions que l’ARNt a avec les ribosomes et les aa-ARNt synth´etases. Les boucles D et TψC s’apparient essentiellement avec les aa-ARNt synth´etases, et leur composition d´etaill´ee en bases permet une s´election sur les interactions possibles (S¨oll and RajBhandary, 1995).
La troisi`eme boucle, dite boucle de l’anticodon, contient trois bases encadr´ees d’une ura-cile et d’une purine. Ces trois bases, num´erot´ees 34, 35 et 36 d’apr`es leur position dans la s´equence de l’ARNt, sont appel´ees anticodon. Elles sont la signature de l’ARNt, car
44 CHAPITRE 2. LE SYST `EME DE TRADUCTION BACT ´ERIEN
Fig. 2.4 – Sch´ema d’un ARN de transfert repli´e. On voit la structure en feuille de tr`efle, ainsi que les bases conserv´ees qui son indiqu´ees dans la s´equence.
elles repr´esentent le ou les codons que va reconnaˆıtre l’ARNt lors de son interaction avec l’ARNm durant la traduction. La tige, quant `a elle, est appel´ee bras accepteur. C’est `a la s´equence CCA qui y est li´ee que va s’apparier un acide amin´e, formant une mol´ecule appel´ee aminoacyl-ARNt, ou aa-ARNt. Cette r´eaction, `a la base de l’existence du code g´en´etique, est catalys´ee par une aa-ARNt-synth´etase.
Les s´equences d’ARNt, parfois not´ees ADNt, sont souvent regroup´ees sur les chromo-somes bact´eriens. Chez les bact´eries, le nombre de s´equences pr´esentes sur un g´enome est tr`es variable, avec un minimum de 30 chez Ureaplasma urealyticum, ce qui est tr`es proche du minimum th´eorique n´ecessaire pour reconnaˆıtre les 61 codons, et un nombre maximal sup´erieur `a 100 (par exemple 107 ARNt d´etect´es chez Bacillus cereus ATCC 14579 (Reis et al., 2004)). En plus de cette vari´et´e, la redondance des g`enes d’ARNt est tr`es variable, avec certaines esp`eces ne poss´edant que des ADNt en unique exemplaire, et d’autre ayant de multiples copies de chaque ADNt. Ces ADNt sont transcrits de nom-breuses fois, puisque on trouve de 100 `a environ 5000 copies de chaque ARNt dans une cellule. Le nombre pr´ecis d’ARNt pr´esent dans la cellule d´epend de l’anticodon consid´er´e, de l’esp`ece, des conditions environnementales et du taux de croissance de la cellule. Au total, on estime que le nombre total d’ARNt pr´esents chezE. coli est compris entre 50000 et 70000, en phase de croissance sur milieu riche (Dong et al., 1996). Les variations sur la concentration d’ARNt dans la cellule jouent un grand rˆole dans la r´egulation de la traduction, comme on le verra au chapitre suivant.
Les s´equences des ADNt sont tr`es variables, mˆeme si la structure des ARNt est conserv´ee grˆace `a une s´election purificatrice intense. Une hypoth`ese expliquant la