I. - BIOLOGIEA PROPOS DU CODE GÉNÉTIQUE

(1)

HAL Id: jpa-00214582

https://hal.archives-ouvertes.fr/jpa-00214582

Submitted on 1 Jan 1971

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

I. - BIOLOGIEA PROPOS DU CODE GÉNÉTIQUE

J. Tavlitzki

To cite this version:

J. Tavlitzki. I. - BIOLOGIEA PROPOS DU CODE GÉNÉTIQUE. Journal de Physique Colloques,

1971, 32 (C3), pp.C3-5-C3-11. �10.1051/jphyscol:1971301�. �jpa-00214582�

(2)

A PROPOS DU CODE GÉNÉTIQUE

J. TAVLITZKI

Institut de Biologie Moléculaire, 9, quai St Bernard, Paris Ve

Tout être vivant, même le plus petit, le plus simple d'apparence, se caractérise par un très haut degré d'or- ganisation. Cette organisation, qui n'est pas statique mais en perpétuel renouvellement, résulte de l'assem- blage de molécules en macromolécules qui s'organisent en structures spécifiques. Cet état organisé se maintient, se transmet et s'accroît. Par exemple, chacun de nous est issu d'une cellule unique, l'œuf qui, au cours du développement subit des remaniements tels (divisions, formation de lignées cellulaires différenciées qui abou- tissent

à

la formation de tissus puis d'organes), qu'il finit par aboutir

à

un organisme extrêmement complexe.

Le degré d'organisation déjà manifeste dans la cellule œuf s'est donc accru dans des proportions considé- rables. Tout se passe comme si l'œuf était doté d'un programme dont les divers éléments s'expriment au cours du temps. Que le programme est bien inscrit dans l'œuf résulte d'une observation courante, celle des faux jumeaux qui, issus d'œufs différents mais se déve- loppant dans le même « milieu », ne se ressemblent pas plus que ne se ressemblent frère et sœur d'âges diffé- rents. Le milieu par conséquent n'a rien

à

voir avec la spécificité, il apporte les conditions nécessaires au déve- loppement (support, aliments..

.).

Ce maintien et cet accroissement du degré d'organi- sation s'effectuent dans un Univers où tous les processus physiques et chimiques obéissent au deuxième prin- cipe de la thermodynamique et où par conséquent, toute organisation tend au contraire

à

se défaire de façon spontanée. Cette propriété essentielle, fonda- mentale, des êtres vivants, propriété qui permet de les distinguer de tous les autres systèmes, ils la doivent au fait qu'ils sont dotés de mécanismes qui leur permet- tent d'utiliser une partie de l'énergie libre qu'ils trou- vent dans les aliments, ou que d'autres sources, la lumière en particulier, leur fournissent. L'utilisation de cette énergie libre, qui n'est pas libérée mais véhi- culée par des molécules spéciales, va permettre la synthèse de molécules spécifiques, l'assemblage de macromolécules dont l'agencement conduit

à

la for- mation de structures organisées.

Ces processus mettent en jeu des chaînes de réactions dont chacune est catalysée par un enzyme spécifique, c'est-à-dire par une protéine spécifique. Par ailleurs, d'autres protéines concourent, avec d'autres macro- molécules

à

l'édification de structures dont l'ensemble forme la cellule

;

certaines sont des hormones et les anticorps sont aussi des protéines. Les protéines

occupent donc une position centrale dans l'architecture et dans le fonctionnement des êtres vivants. Puisqu'il en est ainsi on est conduit

à

se poser la question de savoir ce qui fonde cette spécificité des protéines qui fera par exemple, qu'un enzyme donné ne catalyse en général qu'un seul type de réaction, intéressant le plus souvent une liaison chimique particulière de la molé- cule avec laquelle il réagit, son substrat.

Rappelons brièvement que toute protéine est formée par l'assemblage d'acides aminés

qui diffèrent les uns des autres par la nature du radical R.

Les acides aminés sont liés entre eux de façon covalente, la liaison en cause étant la liaison peptidique (Fig. 1).

Les protéines sont donc des polypeptides.

Toutes les protéines de toutes les cellules de tous les êtres vivants sont ainsi formées par l'assemblage de vingt acides aminés. Une protéine donnée est caracté- risée en première analyse par sa composition en acides

Article published online by EDP Sciences and available at http://dx.doi.org/10.1051/jphyscol:1971301

(3)

C3-6 J. TAVLITZKI

aminés et par le nombre de molécules de chacun de ces

acides aminés. Elles ne contiennent pas toutes les 20 acides aminés. Les chaînes ainsi formées peuvent, selon les protéines comprendre entre 100 et plusieurs centaines d'acides aminés.

En deuxième analyse, une protéine donnée est carac- térisée par l'ordre dans lequel les acides aminés sont disposés les uns par rapport aux autres, par leur séquence. Cet enchaînement des acides aminés, cette séquence constitue ce que l'on appelle la structure pri- maire et elle est spécifique d'une protéine donnée.

La géométrie des atomes, les forces qui s'exercent entre eux ont pour effet de faire adopter aux chaînes polypeptidiques une structure hélicoïdale. Cette struc- ture qui se forme spontanément, est stabilisée par les liaisons hydrogènes qui s'établissent entre les atomes qui forment les liaisons peptidiques, les restes R se trouvant

à

l'extérieur de l'hélice (Fig. 2). Ce type de structureIest la structure secondaire.

Selon les protéines envisagées, les régions hélicoï- dales sont plus ou moins longues et elles s'inter- rompent pour permettre

à

la chaîne de se replier, de se pelotonner sur elle-même, donnant

à

chaque protéine une structure tertiaire qui lui est spécifique. Là aussi les liaisons qui s'établissent pour donner

à

chaque protéine sa configuration la plus stable du point de vue thermodynamique, sont des liaisons non covalentes

:

liaisons hydrogènes, liaisons électro-statiques, interac- tions entre restes non polaires, forces de Van der Waals. Ces liaisons s'établissent cette fois entre les résidus R des différents acides aminés. La structure tertiaire des protéines, leur conformation, est telle que les résidus hydrophobes se trouvent

à

l'intérieur de la structure et qu'elle ménage

à

la périphérie une zone privilégiée qui constitue le site actif où le substrat viendra se loger (Fig. 3). Il y a ainsi formation de

complexes stéréospécifiques réversibles qui conduisent

à

la transformation du substrat.

C'est la conformation d'une protéine qui lui donne ses propriétés réactives et sa spécificité. D'autres molé- cules que les molécules de substrat peuvent se loger soit au site actif, soit en des endroits différents de la molé- cule protéique. Là aussi il y a formation de complexes réversibles et les modifications introduites de ce fait dans la conformation de la protéine se répercutent sur ses propriétés réactives.

C'est la structure primaire d'une protéine qui, en définitive, lui impose sa structure tertiaire et par consé- quent ses propriétés biologiques, et cette conformation s'établit automatiquement, une fois les acides aminés mis en place. Il suffit en effet de traiter une protéine par des agents qui brisent les liaisons non covalentes en respectant les liaisons peptidiques, pour obtenir une chaîne déroulée, dépourvue d'activité. Le retour

à

l'activité est obtenu expérimentalement, en même temps que le retour

à

la conformation initiale.

Enfin, dans de très nombreux cas, c'est l'association de deux ou plusieurs chaînes possédant chacune leur structure tertiaire qui conduit

à

la formation d'édifices actifs. On parle alors de structure quaternaire, les monomères étant eux-mêmes inactifs alors que par exemple, les dimères formés par l'union de deux mono- mères, identiques ou différents, sont seuls actifs. Là aussi l'édification de la structure dotée de propriétés biologiques ne fait intervenir que des forces de liaisons non spécifiques, de faible amplitude et non covalentes.

On en arrive ainsi

à

la notion selon laquelle c'est la séquence des acides aminés d'une chaîne polypepti- dique qui lui impose ses propriétés. Et la question se pose de savoir ce qui est

à

l'origine même de cette séquence spécifique d'acides aminés.

Quand une cellule se divise pour donner naissance

à

deux cellules identiques, ces cellules filles contiennent

les mêmes protéines, identiques dans leur composition

et dans la séquence des acides aminés aux protéines de

la cellule originelle. Tout se passe comme s'il existait

dans la cellule initiale un programme dont la réalisa-

tion conduit

à

la synthèse de protéines spécifiques,

programme qui se retrouve identique dans les cellules

filles, leur imposant les mêmes caractères. Ce pro-

gramme peut être modifié c'est-à-dire qu'une des

cellules produites va différer par un caractère de la

cellule initiale. Elle transmettra cette modification

à

ses

propres descendants. La modification du programme

(4)

est ainsi fidèlement recopiée, transmise héréditaire- ment

:

il y a

mutation.

Bien des structures existent dans une cellule, mais celles qui se divisent en deux parties strictement égales

à

chaque division, sont les chromosomes (Fig. 4).

C Y T O P L A S M E

CHROMOSOMES

sans que les acides aminés adjacents soient modifiés. II est ainsi possible de comparer point par point ;

- la disposition des sites où les mutations ont eu lieu, d'établir la carte du gène

;

- la disposition respective de chacun des acides aminés remplacés

à

la suite d'une mutation, d'établir la carte de la chaîne polypeptidique (Fig. 5).

S i t e s m u t é s

A c i d e s a m i n é s r e m placés

Le programme dont il a été question est donc inscrit dans les chromosomes et une mutation résulte d'une modification d'un chromosome. Les méthodes utilisées en Génétique permettent de localiser en un endroit précis d'un chromosome donné, un segment dont l'alté- ration aboutit

à

la modification d'un caractère donné, l'altération étant fidèlement recopiée au cours des divisions successives. Un chromosome donné apparaît donc comme étant formé par la réunion d'un certain nombre d'unités, les gènes, unités qui lorsqu'elles sont modifiées conduisent

à

l'apparition d'un caractère nouveau.

Le programme c'est donc l'ensemble des gènes, le patrimoine héréditaire. Dans la majorité des cas la mutation d'un gène donné se traduit par l'apparition d'une protéine dont les propriétés et les fonctions sont modifiées

:

un gène donné gouverne la réalisation d'une protéine donnée. L'analyse d'une protéine ainsi modifiée révèle que, très souvent, elle ne diffère de la protéine normale que par le fait qu'un seul acide aminé, situé en un point précis de la molécule a été remplacé par un autre acide aminé. Selon qu'une mutation aura touché telle ou telle partie du gène qui régit la formation d'une protéine donnée, c'est

à

telle ou telle place de la chaîne polypeptidique qu'un seul acide aminé sera remplacé par un autre acide aminé. Ceci

Le contrôle exercé par un gène sur la séquence des acides aminés d'une chaîne est donc extrêmement précis et concerne la mise en place de chaque acide aminé par rapport aux autres.

Quant

à

la nature chimique des gènes, du matériel héréditaire, il s'agit de l'acide désoxyribonucléique, l'acide ribonucléique jouant le même rôle chez certains virus. Un bref rappel de la composition de ces sub- stances

:

ADN ARN

Purines Adénine (A)

Guanine (G)

Pyrimidines Thymine (T) Uracile (U) Cytosine (C)

Sucres Désoxyribose (dR) Ribose (R) Phosphore

Les différents constituants sont liés entre eux pour former de longues chaînes dont l'armature est consti- tuée par des sucres phosphorylés auxquels sont liées les bases puriques et pyrimidiques (Fig. 6), (Fig. 7).

FIG. 6 . - Cycle des pyrimidines. Cycle des purines.

B a s e B a s e B a s e B a s e

l I I 1

- S - P-S-P-S-P-S-P-

FIG. 7.

-

^S⁼Ribose ou désoxyribose.

(5)

C3-8 J. TAVLITZKI

Les molécules d'ADN sont le plus souvent consti-

tuées de deux chaînes hélicoïdales maintenues entre elles par les liaisons hydrogènes qui s'établissent entre A et T d'une part, G et C d'autre part (Fig. 8).

FIG. 8. - S = Désoxyribose.

Chacune des chaînes est donc complémentaire de l'autre, si on considère la séquence des bases, l'ordre dans lequel elles sont disposées les unes par rapport aux autres, et il est clair que dans de telles molécules la seule possibilité de variation provient de la dis- position respective de ces bases. Un gène, c'est donc un segment donné d'une molécule d'ADN, une muta- tion intéressant un gène, ne peut provenir que d'une modification de la séquence des bases.

On en arrive ainsi

à

la conception selon laquelle c'est l'ordre dans lequel les bases sont disposées les unes par rapport aux autres qui impose l'ordre dans lequel les acides aminés d'une chaîne polypeptidique donnée sont disposés les uns par rapport aux autres.

Autrement dit, le programme est écrit dans

un

langage codé dont l'alphabet est formé des 4 lettres A, T, G et C. Ce programme sera finalement traduit en langage protéique dont l'alphabet est composé de 20 lettres, les 20 acides aminés.

Dans un tel système le changement d'une base altère le message et se traduit au niveau de la protéine par le remplacement d'un acide aminé. Ceci a été montré expérimentalement. Encore faut-il que l'alté- ration soit transmise aux générations successives.

Cette transmission du programme et de ses altérations éventuelles est assurée par le mode de synthèse de l'ADN. En effet au cours de cette synthèse, chaque chaîne parentale sert de matrice pour la synthèse d'une chaîne complémentaire qui est donc identique en tous points

à

l'autre (Fig. 9).

Il y a ainsi

à

la fois conservation du message héré- ditaire et transmission de toute modification qui aurait pu y survenir.

Deux étapes principales assurent le décodage qui aboutit

à

la synthèse d'une protéine spécifique

:

une étape de transcription et une étape de traduction.

Au cours de ces processus, la spécificité est assurée par les relations de complémentarité A-U

;

G-C et les éléments qui y interviennent sont eux-mêmes, qu'il s'agisse d'acides nucléiques ou de protéines, régis par des segments d'ADN. Comme J. Monod le dit fort clairement

:

le code ne peut-être traduit que par des produits de sa traduction.

Au cours de ces deux étapes des signaux de ponc-

tuation interviennent, qui commandent le début de lecture d'une phrase, d'un gène, et la fin de lecture.

Des systèmes de régulation sont mis en œuvre qui font intervenir des interactions spécifiques entre protéines et acides nucléiques.

Dans les deux cas enfin, il s'agit de processus orientés qui débutent en un point donné et se pour- suivent toujours dans la même direction.

Transcription. - Une des chaînes de l'ADN sert de matrice pour la biosynthèse d'une molécule d'ARN messager (ARN,)

La réaction est catalysée par un enzyme spécifique : l'ARN polymérase

à

partir des 4 précurseurs :

P - P - P - R - A P - P - P - R - G P - P - P - R - U P - P - P - R - C

Traduction.

-

C'est I'ARN, synthétisé qui va

servir de guide pour la mise en place séquentielle des

acides aminés.

(6)

La traduction est un processus complexe dont toutes les réactions ne sont pas encore élucidées. Sans entrer dans les détails il suffit de signaler ici que la traduction, la biosynthèse des protéines, s'effectue au niveau des ribosomes, particules qui contiennent une molécule d'ARN (ARN ribosomique), englobée dans une structure protéique formée par la réunion de nom- breuses protéines. L'ARN, et le ribosome forment un complexe (Fig. 10).

FIG. 12.

-

Met = Formyl-méthionine,

pris il s'agit de l'ARN, lié

à

l'acide aminé histidine (Fig. 13).

FIG. 10. - Ribosome (2 sous-unités).

C'est au niveau de ce complexe que viennent se fixer les molécules traductrices, les ARN de transfert (ARN,), chaque ARN, ayant été au préalable couplé

à

un acide aminé particulier, réaction catalysée par un enzyme spécifique (Fig. 11).

FIG. 11. - ARN de transfert ARNt (environ 80 bases pour chaque molécule d'ARNt).

C'est la complémentarité des bases entre l'ARN,,, et l'ARN, qui guide les processus et qui est donc

à

l'origine de la spécificité. Le premier ARN,

à

se mettre ainsi en place, celui par lequel débute la traduction est l'ARN, couplé

à

un dérivé de la méthionine (un des 20 acides aminés). La lecture du message commence par les 3 bases AUG, qui constituent le signal de début de lecture (Fig. 12).

Le deuxième ARN,

à

se mettre en place, correspond aux trois bases suivantes du messager. Dans l'exemple

FIG. 13. - His = histidine.

Les deux acides aminés ainsi mis en place sont liés entre eux et le premier ARN, est libéré (Fig. 14).

Il y a ensuite translation et mise en place d'un troisième ARN, - acide aminé (Fig. 15).

Fro. 15.

-

Ala = alanine.

(7)

C3-10 J. TAVLITZKI

Le processus se poursuit jusqu'à ce que les trois

bases UAA ou UAG qui sont des signaux de fin de lecture soient rencontrées. La protéine synthétisée est alors libérée et prête

à

jouer son rôle.

La spécificité, l'ordre dans lequel les acides aminés sont mis en place est donc assurée par i'ordre dans lequel se trouvent disposées A, U, G et C dans I'ARN,. Cet ordre dérive

à

son tour de celui des éléments A, T, G et C du segment d'ADN qui a servi de matrice pour la synthèse de cet ARN,.

Ce sont donc des groupes de 3 bases qui intervien- nent, chaque groupe constituant ce que l'on appelle un codon et grâce

à

de remarquables travaux, nous connaissons maintenant le dictionnaire qui permet la traduction, la grille de décryptage. C'est-à-dire que nous savons qu'à tel acide aminé, correspond tel codon de YARN messager.

Voici un exemple, parmi bien d'autres des méthodes utilisées.

Il est possible de synthétiser par voie chimique et enzymatique des ARN, artificiels dont la séquence des bases est connue. Si l'on introduit ces ARN dans un mélange réactionnel qui contient en particulier des ribosomes, des ARN de transfert et les acides aminés ainsi que les enzymes nécessaires, il y a syn- thèse au cours de la réaction de polypeptides que l'on peut isoler et analyser.

Un premier ARN de ce type était (AAG) : AAGAAGAAG ...

On constate qu'il y a formation de 3 polypeptides chacun formé par la répétition d'un seul acide aminé

:

poly-lysine poly-arginine poly-glutamique.

Ce résultat s'interprète au mieux si la synthèse commence en un point et se poursuit toujours dans la même direction, faisant intervenir

à

chaque fois 3 bases

:

soit AAG . AAG . ^AAG

soit AGA . A G A . AGA soit G A A . G A A . GAA

D'autres méthodes permettent de montrer que AAG signifie lysine, AGA, arginine

;

GAA glutamique.

Il convient de remarquer que ce système, comme d'autres, permet de démontrer sans ambiguïté que c'est bien la séquence des bases qui impose la spéci- ficité. En effet les 3 codons en question ont exactement la même composition

:

2 A - 1 G. Ils ont pourtant chacun un sens, une signification différente.

Deuxième exemple

:

(UC)

:

UCUCUCUC

Ici 2 codons sont possibles UCU suivi de CUC CUC suivi de UCU.

On doit donc s'attendre

à

obtenir toujours le même polypeptide qui sera formé par la répétition de deux

acides aminés. On trouve effectivement sérine-leucine- sérine-leucine.. .

Troisième et dernier exemple.

a) (CAA) CAACAACAACAA

:

codons CAA, AAC et ACA.

il y a synthèse de

3

homopolymères

:

(glutamine)"

(asparagine)"

(thréonine)".

b) (AC) ACACACAC

:

codons ACA et CAC.

11 y a synthèse d'un polypeptide (thréonine-histi- dine)".

Le seul codon commun est ACA

;

le seul acide aminé commun est la thréonine. Par conséquent ACA code pour la thréonine tandis que l'autre codon CAC code pour l'histidine.

L'examen du dictionnaire des codons permet de faire un certain nombre de constatations.

Tout d'abord le code est universel c'est-à-dire que ce sont les mêmes codons qui chez tous les organismes, spécifient les mêmes acides aminés.

-

Le code est dégénéré c'est-à-dire que plusieurs codons ont la même signification et la plupart du temps ils ne diffèrent que par une seule base.

C

En voici un exemple

:

Gu 1 ^y ont le même sens

:

les codons valine.

G

- La dégénérescence se traduit dans certains cas par des codons qui diffèrent complètement

:

Ainsi pour l'arginine on a le groupe

Dans des cas de ce genre on trouve 2 ARN de transfert différents qui chacun sont spécifiés par un des groupes de codons. L'analyse de la séquence des bases des ARN de transfert qui ne concerne encore qu'un petit nombre de ces molécules laisse apparaître en une région de la molécule un groupe de

3

bases complémentaires du codon correspondant

:

l'antico- don.

Il apparaît en tout cas que dans de nombreux exemples, les deux premières bases du codon sont celles qui imposent la spécificité, la troisième, qui est cependant nécessaire, n'étant pas spécifique.

Pour rendre compte de ces résultats il suffit de sup- poser avec Crick que les 2 premières bases d'un codon obéissent strictement

à

la règle de complémentarité

:

A-U

;

G-C. Des appariements non conformes

à

cette règle peuvent intervenir pour les troisièmes bases du type

:

G-U

;

C-A

;

A-A.

Ceci implique qu'il y a possibilité de former des

liaisons hydrogènes entre ces couples de base. C'est

(8)

effectivement le cas, mais dans ces conditions les riboses se trouvent plus éloignés que dans les appariements classiques. 11 faut donc admettre qu'il puisse exister un certain jeu, au sens où un jeu peut intervenir entre des pièces mécaniques. Ce jeu est possible puisque dans les appariements codon-anti- codon, les structures formées n'ont pas

à

être aussi rigides que dans les molécules d'ADN où les appa- riements A-G ou T-C, conduisent dans le premier cas

à

des empêchements stériques, dans le deuxième

à

l'absence de formation de liaisons hydrogènes, du fait des faibles dimensions des deux pyrimidines.

Pour le biologiste l'unité ultime, insécable à laquelle il parvient c'est la base. Mais une base isolée n'a pas de signification. Elle ne l'acquiert que si elle fait partie d'une unité d'ordre supérieur qui est le codon de trois bases.

Quelques remarques pour terminer :

20, 4,

3, 1 ; A-T

;

G-C. En réalité cette lumineuse simplicité, dont Pythagore eût été ravi, n'est que le reflet de phénomènes extrêmement complexes.

Le message codé peut être comparé

à

un programme,

à

une partition musicale. Il est clair qu'il existe une différence fondamentale quant

à

la nature même des systèmes comparés. Le programme codé qui commande

à

distance la marche d'un véhicule sur la lune a été établi par des programmeurs

;

le plan d'exé- cution qui permettra la construction d'un pont est élaboré par un ingénieur, la partition d'une symphonie a été écrite par Mozart ou Beethoven. Le programme de i'ADN, les instructions qui seront mises en œuvre n'ont l'homme ni pour origine, ni comme exécutant : il n'y a pas d'interprètes, il n'y a pas de chef d'orches- tre.