• Aucun résultat trouvé

Chapitre 3

Code g´ en´ etique et usage de codons

64 CHAPITRE 3. CODE G ´EN ´ETIQUE ET USAGE DE CODONS

Fig. 3.1 – Le code g´en´etique standard.

Ces propri´et´es structurelles du code seront ´etudi´ees plus en d´etails dans quelques lignes.

3.1.1 Les r` egles de reconnaissance floue entre ARNt et ARNm

Malgr´e la d´eg´en´erescence du code g´en´etique, on pourrait supposer que le syst`eme de traduction a ´evolu´e de fa¸con `a associer `a chaque codon un ARNt ayant l’anticodon correspondant, tout comme chaque acide amin´e est directement charg´e sur ses ARNt par une synth´etase bien pr´ecise1. Quelques valeurs num´eriques permettent rapidement de voir que cette m´ethode de reconnaissance extensive n’est pas employ´ee par les organismes bact´eriens : en effet de nombreux procaryotes contiennent au total moins de 61 ARNt, par exempleHaemophilus influenzaeouM. leprae, ce qui rend impossible toute reconnaissance fid`ele et extensive, de cette fa¸con, des codons port´es par l’ARNm. De plus, parmi les organismes poss´edant plus de 61 ARNt, certains anticodons ne sont pas repr´esent´es parmi les ARNt. Par exempleE. coli contient 86 ARNt, mais au total seulement 39 anticodons sont utilis´es. De mˆeme pour Vibrio fischeri ES 114, qui malgr´e ses 119 ARNt n’utilise que 41 anticodons diff´erents.

Les ARNt pr´esents dans l’organisme ont donc une mission difficile : ils doivent ˆetre capables, en plus du codon compl´ementaire `a leur anticodon, de reconnaˆıtre d’autres codons, afin que ceux ci puissent ˆetre traduits. Il s’agit de l’hypoth`ese de reconnaissance floue, ´emise par F. Crick ´egalement (Crick, 1965). De plus, ils ne doivent pas s’apparier

1Dans certains cas, comme l’asparagine, c’est un acide amin´e proche qui est charg´e sur l’ARNt, puis modifi´e (Di Giulio, 2005a).

3.1. LE CODE G ´EN ´ETIQUE 65 avec les codons non synonymes. Les crit`eres de reconnaissance doivent donc ˆetre tr`es pr´ecis. Nous allons les r´esumer ici (voir Table 3.a).

La reconnaissance entre codon et anticodon est un processus complexe, d´etermin´ee non seulement par l’appariement de bases compl´ementaires, mais aussi par l’hydrolyse d’une mol´ecule de GTP, et la stabilisation des interactions entre ARN ribosomal, ARNt et ARNm (Agris, 2004). La multiplicit´e des interactions et la sp´ecificit´e de la structure du ribosome et des ARNt permettent une reconnaissance pr´ecise de certains codons par des anticodons non compl´ementaires, notamment au niveau de la premi`ere base de l’anticodon, tout en assurant un taux d’erreur `a l’insertion tr`es faible, de l’ordre de 10−4.

Tout d’abord, il faut savoir que les deux premi`eres bases du codon, correspondant aux bases 35 et 36 sur l’ARNt1, doivent ˆetre parfaitement compl´ementaires aux deux premi`eres bases de l’anticodon pour que la reconnaissance ait lieu. L’int´erˆet d’un tel m´ecanisme peut ˆetre compris ais´ement en examinant la figure 3.1 : `a l’exception des acides amin´es d´eg´en´er´es 6 fois, chaque acide amin´e est caract´eris´e par les deux premi`eres bases de ses codons. Le probl`eme de la reconnaissance floue peut donc se poser ainsi : comment un anticodon peut-il s’apparier avec plusieurs codons ayant des troisi`emes bases diff´erentes, sans forc´ement reconnaˆıtre toutes les troisi`emes bases possibles, ce qui poserait un probl`eme au niveau des codons d´eg´en´er´es 2 ou 3 fois ? Deux autres bases sur l’ARNt ont un rˆole essentiel dans ce m´ecanisme : il s’agit de la base 34, celle reconnaissant la troisi`eme base du codon, et de la base 37, qui peut st´eriquement influencer le lien entre la base voisine 36 et la premi`ere base de l’anticodon. L’importance de cette base a donn´e lieu `a l’appellation d’anticodon

´etendu pour les bases 34 `a 37 de l’ARNt (Yarus, 1982). En ce qui concerne la base 37, on r´esumera simplement en disant qu’il s’agit en r`egle g´en´erale d’une purine (A, G ou un de leurs d´eriv´es) et qu’elle est tr`es souvent soumise `a des modifications sur l’ARNt qui augmentent la sp´ecificit´e de ce dernier pour certains codons.

Anticodon 34 Base reconnue

A Non utilis´e

I U,C,A

C G

G C,U

U A,G

Umodif G ou A,G ou A,G,U,C

Tab.3.a – R`egles de reconnaissance floue entre l’anticodon 34 de l’ARNt et la troisi`eme base du codon. Umodif repr´esente les trois possibilit´es de mutations observ´ees sur U, avec les trois reconnaissances associ´ees.Inspir´ee de Agris et al. (2007)

Au niveau de la base 34, des r`egles claires ont ´et´e observ´ees. La base C34 – qui d´enote une base C en position 34 sur l’ARNt – ne s’apparie qu’avec son compl´ementaire G, et G34s’apparie avec les pyrimidines C et U. L’ad´enine A34 n’est quasiment jamais observ´ee dans l’ARNt ; mˆeme au niveau de la s´equence g´en´etique, seulement 12% des g`enes codant pour un ARNt reconnaissant 4 codons synonymes ont une ad´enine en position 34 (Sprinzl

1Les bases de l’anticodon sont num´erot´ees d’apr`es leur place dans la s´equence de l’ARNt. Elles portent les num´eros 34, 35 et 36, et s’apparient respectivement `a la derni`ere base du codon sur l’ARNm, celle du milieu et la premi`ere.

66 CHAPITRE 3. CODE G ´EN ´ETIQUE ET USAGE DE CODONS and Vassilenko, 2003). La reconnaissance des codons finissant par T s’effectue `a la place grˆace `a une inosine I34, car l’inosine permet au complexe ribosomal d’ˆetre plus stable une fois l’ARNt d´eplac´e au site P (Agris, 2004). Au niveau des ARNt reconnaissant les codons 4 fois d´eg´en´er´es, c’est U34 qui est observ´e le plus souvent, suivi par G34 (Rocha, 2004). U peut normalement s’apparier avec les purines A et G, mais des modifications chimiques de U34 permettent `a certains ARNt de reconnaˆıtre tout ou partie des 4 bases A, C, T et G, r´esolvant le probl`eme des codons 4 fois d´eg´en´er´es. Pour les codons deux fois d´eg´en´er´es, la possibilit´e pour G34 de s’apparier avec les deux pyrimidines C et T, et pour U34 de reconnaˆıtre les purines, permet ´egalement `a un seul ARNt de servir pour deux codons diff´erents. Il est connu que pour la ph´enylalanine, la tyrosine et l’asparagine, trois acides amin´es cod´es par seulement deux codons (respectivement TTT/TTC, TAT/TAC et AAT/AAC), un seul ARNt dont l’anticodon contient toujours G34 reconnaˆıt les deux codons. Ceci n’est possible que grˆace `a la structure particuli`ere des codons deux fois d´eg´en´er´es, qui se terminent toujours soit par une purine, soit par une pyrimidine.

Les r`egles de reconnaissance floue sont tr`es l´eg`erement diff´erentes dans les g´enomes mitochondriaux, et ceux de certaines bact´eries, comme Mycoplasma capricolum. Ceci au-torise ces g´enomes, tr`es r´eduits, `a minimiser le nombre d’ARNt n´ecessaires `a la traduction des 61 codons sens :M. capricolum n’utilise au total que 29 ARNt diff´erents, sur un mini-mum de 26 th´eoriquement possible pour ne pas commettre d’erreur de d´ecodage (Marck and Grosjean, 2002).

3.1.2 La structure du code g´ en´ etique est-elle optimale ?

Le code g´en´etique n’est pas organis´e de mani`ere al´eatoire. On a d´ej`a remarqu´e pr´ec´ edem-ment que les r`egles de reconnaissance floue ne fonctionnaient que grˆace `a la structure par-ticuli`ere du code, les codons synonymes ´etant “proches” dans le code. Un code g´en´etique al´eatoire, compl`etement brass´e, n’aurait pas cette propri´et´e, et n´ecessiterait un appa-reillage mol´eculaire beaucoup plus important, en termes d’ARNt du moins, pour que la traduction puisse avoir lieu. On peut donc consid´erer le code g´en´etique comme optimis´e de ce point de vue, `a savoir de fa¸con `a minimiser le nombre d’ARNt diff´erents n´ecessaires

`

a la traduction.

Mais le code g´en´etique est structur´e ´egalement `a d’autres niveaux. De tr`es nombreux travaux sur ce th`eme ont ´et´e poursuivis. Nous n’en citerons que quelques-uns. Une des th´ematiques qui a ´et´e la plus explor´ee est celle visant `a montrer que le code g´en´etique est construit de mani`ere `a ˆetre robuste face `a des mutations ponctuelles (Freeland and Hurst, 1998; Goodarzi et al., 2007, 2005; Haig and Hurst, 1991), de mani`ere `a ce que :

– Une mutation simple conduise le plus souvent possible sur un codon synonyme. Ce serait une autre raison pour laquelle les codons synonymes sont associ´es en blocs, et pour laquelle les acides amin´es d´eg´en´er´es 6 fois ont des codons situ´es dans la mˆeme colonne1. Ceci implique qu’une mutation ponctuelle sur certains codons de l’arginine (CGA et CGG) ou de la leucine (CTA et CTG) a 5 chances sur 9 de toujours coder pour le mˆeme acide amin´e. On peut estimer l’importance de cette structure en sachant que, en g´en´eral, l’usage des acides amin´es est proportionnel au nombre de codons qui leurs correspondent, et donc que ces acides amin´es sont tr`es employ´es en g´en´eral.

1A l’exception de la s´` erine, le seul acide amin´e dont tous les synonymes ne soient pas adjacents `a une mutation pr`es.

3.1. LE CODE G ´EN ´ETIQUE 67