Evolution moléculaire: aspects choisis
Plasticité du génome: chromosomes et gènes Plasticité et évolution des protéines
Evolution dirigée: exemples d'ingénierie du code génétique
Sur les échelles de temps courtes, la diversité génétique
provient du brassage de chromosomes via reproduction sexuée
Combien avonsnous d'ancêtres au temps de Charlemagne?
Un monde sans évolution: équilibre de HardyWeinberg
Femelle
A a allèle
p q fréquence
a q Aa aa
pq q2
A p AA Aa
p2 pq
eâlM Génotypes de la
descendance et leurs fréquences
En effet: fréquences dans les gamètes filles: A: p' = p2 + pq = p a: q' = 1p' = q Fréquences inchangées (normal: pool de gamètes constant). Idem pour n>2 allèles
La variabilité génétique de la population reste inchangée.
Organismes diploides, pas de mutations ni sélection, population infinie, “panmictique”
Ces valeurs
sont inchangées au fil des
générations
Synténie Homo sapiens – Mus musculus
Brassage de fragments chromosomaux: la synténie
Notion de “synténie”
= sur le même ruban
100 Ma
Chromosome II humain
Weinberg et al, Chrom Res (1994) 2:405
Brassage de fragments chromosomaux: la synténie
Chromosomes homologues de chimpanzee Notion de “synténie”
= sur le même ruban
6 Ma
“Translocations chromosomales”
Chromosomes humains
Synténie Homo sapiens – Poisson zèbre
Des accidents cellulaires ou chromosomiques majeurs possibles:
duplications, divisions interrompues
Nature (2004) 617:428
Duplication complète du génome de levure
Anomalies des chromosomes sexuels, trisomie
Recombinaison homologue (ou non)
Chromosomes méiotiques (métaphase)
Chen et al, Nature Reviews Genetics 8, 762775 (2007)
Cooccurrence de gènes: phylogénie
La présence/absence/localisation de gènes est caractéristique d'une espèce Exemple: protéines présentes dans les 3 “domaines” du vivant,
eucaryotes, eubactéries, archées: issues de LUCA?
Nombre de gènes
Protéines ribosomales 30
Aminoacyl ARNt synthétases 15
Facteurs de traduction 6
Enzymes de mofification de l'ARN et des protéines 3 Consituants de la Signal Recognition Particle (sécrétion) 3
Protéine chaperone/protéase 1
Sousunités de l'ARN polymérase 3
Facteurs de processivité des ADN polymérases 3 Topoisomérase IA, recombinase, Rad50/Mre11 4
ATP synthétases 2
TOTAL 70
Traduction, fonctions associées
Transcription Réplication Réparation Métabolisme
Cooccurrence de gènes: prédiction de fonction
Soit les gènes d'un certain sousensemble sont tous présents dans un génome,
soit ils sont tous absents : on ne trouve pas l'un sans les autres lien fonctionnel→
Inférer gènes liés fonctionnellement.
Exemple: reconstruction de voies métaboliques ou de signalisation.
De plus: la proximité génomique est corrélée à l'interaction physique entre les protéines.
Pellegrini (2001) Curr Opin Chem Biol
Éléments génétiques mobiles
Transposons (Barbara McClintock, prix Nobel 1983)
Retrovirus (David Baltimore, découverte de la transcriptase inverse) INterspersed Elements: SINE/LINE
La plupart des séquences “répétées” de notre
génome proviennent d'éléments génétiques mobiles
VIH1: un rétrovirus
génome ARNsb diploïde
copié par une transcriptase inverse (RT)
http://www.hiv.lanl.gov HIV sequence database
VIH1: un rétrovirus
génome ARNsb diploïde
certains gènes sont épissés
recouvrement partiel de gènes
copié par une transcriptase inverse (RT)
la RT utilise comme amorce une ARNt
présence dans la particule virale de protéines et ARN nécessaires pour démarrer son cycle de vie
la RT est peu fidèle: mutations
elle a trois activités: ADN polymérase, ARN polymérase, Rnase
Transcription inverse: modèle naïf
génome ARNsb diploïde
copié par une transcriptase inverse (RT)
la RT utilise comme amorce une ARNt
la RT a trois activités:
ARN polymérase, ADN polymérase, RNase
RT 3'
ARN génomique viral ARNt(Lys)
3' ARN génomique viral ADN complémentaire dégradation de l'ARN ADN
ADN double brin
Quel est le problème posé par ce modèle?
A AATxxxxxxxGxx
xxxxTTGACAxxxxxxxxxxxxxxxxxTAT xxxxxxx xxxxAACTGTxxxxxxxxxxxxxxxxxATA xxxxxxx TTAxxxxxxxTxx
C
Start of
transcription Local fusion
Of the DNA
“35”
sequence
“10”
sequence
Transcribed strand Spectator strand
Purine
3 regions upstream of the START site allow RNA polymerase 2 binding and the initiation of transcription of an ORF (open reading frame): they form the promoter.
Un élément génétique mobile doit soit être toujours inséré
près d'un promoteur endogène, soit pouvoir emporter son
propre promoteur lors de sa transcription: comment faire?
Transcription inverse: modèle détaillé
U3 contient le promoteur.
Notez la répétition de R.
L'ARNt sert d'amorce pour la RT
Le brin ADN (rouge) se dissocie et se réassocie côté 3' via le 2ème R (ou s'associe à l'autre ARN viral)
Extension ADN et digestion ARN+. PP = segment polypurine résistant, nondigéré à ce stade
PP sert d'amorce pour synthèse du brin ADN+ bleu, puis est digéré
Circularisation du brin rouge via PB:PB'; extension du brin bleu, jusqu'au bout du brin rouge
Après intégration dans le génome hôte, notez la position et le dédoublement des promoteurs (U3) et du LTR = “Long Terminal Repeat”
(Y Gaudin, Bio451, Fig 14.14)
ARNviral
ADNdb
Site d'intégration (AA)
– TATAAA –
– AATAAA – Promoteur
Signal de polyadénylation
d'initiationSite
Future coiffe
Sited'intégration (TT)
Site de terminaison polyA
Séquence répétée
R U5
U3
Séquence répétée
gag pol env
LTR LTR
Structure détaillée du “Long Terminal Repeat”
cf http://www.hiv.lanl.gov
Que se passetil si on perd l'activité env?
Wikimedia Commons
Des éléments génétiques mobiles: les transposons
gag pol LTR
Cidessous: un retrotransposon: Presqu'un rétrovirus; pas de gène env
Plusieurs types; eg LINEs (Long INterspersed repetitive Elements):
68 kbases
produisent des copies d'euxmêmes: expansion du génome
500,000 exemplaires dans notre génome: 17% du génome
SINES (Short etc): 1,500,000 dans notre génome (11% du génome) Transposons = 50% du génome du maïs
Mécanisme copier/coller ou couper/coller ( transposase)← Nombreuses applications en biotechnologie
Effets biologiques, eg via leur 2ème promoteur (LTR de droite): oncogènes Ne pas confondre avec les séquences mini ou microsatellites
LTR
Un SINE de ~300 nt, qui descend d'un petit ARN ribosomal: 7SL
L'élément répété le plus abondant de notre génome (106 copies = 11%!) Transcrit par l'ARN Polymérase III, qui utilise un promoteur interne Ne code pour aucune protéine; utilise les protéines cellulaires
Nature (2011) 469:529
Un exemple de “Small INterspersed Element”: les séquences Alu
Énorme expansion humaine récente;
aujourd'hui inactif 284 nt
Séquences “répétées”
nématode drosophile humain Pseudogènes
LINE/SINE 0.4% 5% 28%
Séquences 0% 6% 8%
rétrovirales
Transposons 5% 4% 3%
Total 7% 15% 39%
ADN satellite dans le centromère
répétition d'une séquence courte (10100 nt)
Minisatellites répétition d'une séquence courte (10100 nt); ~1 kb chacun
~1000 dans notre génome; souvent télomériques Microsatellites motif de 110 nt, répété 10100 fois;
répartition assez uniforme marqueurs/carte physique→
polymorphisme (nb de répétitions) génotypage, phylogénie→ Éléments “dispersés”
ou “interspersed”;
origine virale
A Bernot, Analyse de Génomes (2001)
Séquences “répétées”
nématode drosophile humain
LINE/SINE 0.4% 5% 28%
Séquences 0% 6% 7%
rétrovirales
Transposons 5% 4% 3%
Taille du génome (Mb)
Nombre de transposons
Présence de transposons à partir d'une certaine taille du génome
nombre
fraction du génome
Séquences “répétées”
nématode drosophile humain
LINE/SINE 0.4% 5% 28%
Séquences 0% 6% 8%
rétrovirales
Transposons 5% 4% 3%
Taille du génome (Mb)
Nombre de transposons Taille
moyenne (nt)
nombre moyen par gène
Présence/taille d'introns
Lynch, Science '03 nombre
fraction du génome
Des accidents cellulaires ou chromosomiques majeurs possibles:
duplications, divisions interrompues, phagocytose/endosymbiose
Nature (2004) 617:428
Duplication complète du génome de levure
Anomalies des chromosomes sexuels, trisomie
la mitochondrie:
endosymbiose →
“transfert” de gènes
Arbre de la vie, ou cercle?
Le premier eucaryote est peutêtre apparu par
fusion/symbiose d'une eubactérie et d'une archébactérie.
eucaryote
eubactérie
archébactérie Ancêtre
commun Ernst Mayr, What Evolution Is (2001) Fig 3.2
Arbre de la vie: une vue moderne
La structure hiérarchique de l'arbre modélise les spéciations successives.
Evolution moléculaire: aspects choisis
Plasticité du génome: chromosomes et gènes Plasticité et évolution des protéines
Evolution dirigée: l'exemple des aminoacylARNt synthétases
Des peptides aléatoires peuvent se replier et être fonctionnels
Parmi une librairie de séquences aléatoires, de longueur ~80 aa, et principalement
composées de R, Q, L, 5% se replient
(faiblement);
PNAS (1994) 91:2146
Parmi une librairie de 1013 séquences, de longueur ~100 aa,
~10 fixent une protéine:
la streptavidine;
Szostak et coll
PNAS (2001) 98:3750
Des peptides aléatoires peuvent se replier et être fonctionnels
Parmi une librairie de séquences aléatoires, de longueur ~80 aa, et principalement
composées de R, Q, L, 5% se replient
(faiblement);
PNAS (1994) 91:2146
Parmi une librairie de 1013 séquences, de longueur ~100 aa,
~10 fixent une protéine:
la streptavidine;
Szostak et coll
PNAS (2001) 98:3750
Science (2003) 302:1364
Top7
Une protéine artificielle
Des peptides simples peuvent se replier et être fonctionnels
couverture
rms Repliement d'homopolypeptides:
génération in silico de conformations compactes qui établissent de nombreuses liaisons hydrogènes:
83% sont proches d'une structure de la PDB
Inversement, les structures de la PDB ont généralement un homologue structurale chez ces homopolypetides.
La plupart des domaines naturels semblent connus.
Les plis naturels semblent émerger de considérations simples de compacité, hydrophobicité, et satisfaction des liaisons hydrogènes. PNAS (2006) 103:2065
Classe
Classe
Classe
100 superfamilles
= 60% des domaines
L'espace des plis est discret et fini
Le domaine comme unité de l'évolution
AspartylARNt synthétase de levure AspartylARNt synthétase
d'E coli
Tyrosine kinase cSrc
“SH3” domain:
found in >150 proteins of known structure. 23 in yeast alone.
deuxchromosomes mésappariés recombinaison homologue
expansion/
contraction du motif ou domaine
Un mécanisme pour ajouter/enlever un motif, gène, ou domaine
Les mutations ponctuelles
Altérations chimiques spontanées de l'ADN
oxidation/désamination (eg, Cyt Ura, 100/jour/cellule)→ autres dommages oxidatifs (via superoxide, peroxide) méthylation (change les appariements; provoque G A)→ Erreurs de l'ADN polymérase
favorisées par des molécules chimiques exogènes (et mutagènes), eg, intercalants dans l'ADN (benzène, ...)
Rayonnements ionisants
UV, rayons X dimérisation de pyrimidines→ Systèmes de protection simples ou sophistiquées
ADNdb, diploïdie
redondance/robustesse du code génétique systèmes de réparation de l'ADN
systèmes de protection antioxidants,
dont l'ADN noncodant (pouvoir réducteur)
Les mutations peuvent être délétères, neutres, ou avantageuses
The origins, determinants and consequences of human mutations
Shendure & Akey, Science 2015
60 mutations ponctuelles apparues dans les cellules germinales de nos parents et héritées par nous
1011 mutations germinales apparues dans la dernière génération humaine
Environ 108 mutations par base et par génération
Mutations somatiques dans les tissus les plus prolifératives: à 60 ans, environ une mutation à chaque site du génome dans une cellule au moins Mutations silencieuses ou non... (comparer Homo sapiens/chimpanzee) 1000 Genome Project http://browsers.1000genomes.org/index.html Cancer Genome Project http://www.sanger.ac.uk/genetics/CGP
paternelAge
Nombre de mutations
Taux de mutation ponctuelle dans quelques protéines
Molecular Evolution;
Page, Holmes; 1998
Chave, Biodiversité, 2009
Mutations synonymes ou non, neutres, délétères, ou avantageuses
Hypothèse:
les mutations synonymes sont neutres
les mutations nonsynonymes servent principalement à éliminer des variants délétères (sélection négative)
l'absence de mutations nonsynonymes indique une contrainte fonctionnelle (sélection positive)
Alors:
nombre de mutations nonsynonymes
nombre de mutations synonymes indicateur de
pression sélective
=
Sélection positive Sélection
négative Pas de sélection
Monget p299
L'évolution choisie:
évolution dirigée et ingénierie du code génétique
Anticodon
Acide aminé
-
GUC
CAG ARNm
Aminoacyl-
ARNt synthétase
“Evolution dirigée” et extension du code génétique:
Ingénierie d'un couple ARNtaminoacylARNt synthétase
appariement sur le ribosome
Anticodon
Acide aminé-
CUA
TAG ARNm
Aminoacyl-
ARNt synthétase mutée
suppression de codons STOP
Evolution dirigée et extension du code génétique: création d'un nouveau couple ARNt – aminoacylARNt synthétase
L'ARNt muté va pouvoir “supprimer” des codons STOP L'enzyme muté ne peut interagir qu'avec cet ARNt.
ARNt muté
Evolution dirigée et extension du code génétique
TyrRSMj(muté)
Gène CAT(muté):
résistance au chloramphenicol
TyrARNtMj(muté)
Plasmide 1
+
Plasmide 2Bibliothèque de mutants aléatoires
Si la TyrRS mutée est capable d'aminoacyler l'ARNt muté avec un acide aminé (Tyr ou autre), alors l'ARNt va pouvoir supprimer un codon STOP qu'on a inséré au milieu du gène CAT: possibilité de sélection.
TAG
Evolution dirigée et extension du code génétique
TyrRSMj(muté)
Gène CAT(muté)
TyrARNtMj(muté)
Plasmide 1
+
Plasmide 2Bibliothèque de mutants
E. coli
+ aa X
+ antibiotique
Evolution dirigée et extension du code génétique
TyrRSMj(muté)
Gène CAT(muté)
TyrARNtMj(muté)
Plasmide 1
+
Plasmide 2Bibliothèque de mutants
E. coli
Sélection des survivants + aa X
+ antibiotique
Enzyme, ARNt compétents pour X
OU Tyr
Evolution dirigée et extension du code génétique
TyrRSMj(muté)
Gène CAT(muté)
TyrARNtMj(muté)
Plasmide 1
+
Plasmide 2E. coli
Bibliothèque de mutants
Sélection des survivants + aa X
+ antibiotique
Enzyme, ARNt compétents pour X
OU Tyr
E. coli
aa X+ antibiotique Enzyme, ARNt
compétents pour X mais pas Tyr
Sélection des NON survivants
X peut être un acide aminé nonnaturel!
Evolution dirigée et extension du code génétique
Activé par photons Réactif:
modifications chimiques de
protéines
Atome lourd (I) résolution de
→ structures cristallograhiques
Codage de X par un codon TAG dans un gène choisi.
Il faut ajouter à la bactérie une voie métabolique pour synthétiser X.
On peut aussi développer des ribosomes mutants spécialisés.
E coli sans codon stop Ambre UAG codon rare dans E coli
élimination de l'ARNt “suppresseur” qui le reconnait apport de quelques gènes sur plasmide
réutilisation de UAG comme nouveau codon sens Nucleic Acids Research (2010) 38:8188
Evolution dirigée et extension du code génétique
Les 20 aa habituels avec leur 61 codons
+
un codon STOP reconverti et utilisé pour coder la méthyl
tyrosine = 21ème aa
Sequence, evolution, function. Koonin, Galperin; Kluwer, 2003 Molecular evolution. Page, Holmes; Blackwell, 1998
Fundamentals of molecular evolution. Li, Gaur; Sinauer, 1991 Biodiversité, Jérôme Chave, Ecole Polytechnique; 2009 et 2010
“Des virus ontils inventé l'ADN?” P Forterre, Pour la Science, 2008
“Tant va l'autruche à l'eau qu'à la fin elle se palme” (R Queneau)