Dynamique et évolution des génomes
Bernard Dujon Cours BIM 3 novembre 2009
Charles Robert Darwin (1809-1882)
Les séquences des homologues divergent Les cartes génétiques se réarrangent
Les lots de gènes ne se chevauchent que partiellement, même entre espèces voisines
Espèce 1 127 4867 85 Espèce 2
Lot commun de gènes
Gènes spécifiques à l'espèce 1 Gènes
spécifiques à l'espèce 2
Les organismes vivants n'évoluent pas, ils se reproduisent. Ce sont les populations qui évoluent.
Principes généraux de l'évolution des génomes
Les génomes ne sont que des instantanés de structures en évolution constante à chaque génération.
Les génomes des individus d'une même espèce ne sont pas strictement identiques.
Divergence de séquences Horloges moléculaires Générations successives
Dérive génétique Sélection Erreurs de réplication
Perte de gènes Duplication de
gènes
Redondance des génomes Générations successives
Formation de gènes
Nouveaux gènes
Perte de gènes
Générations successives
Réarrangements chromosomiques
Délétion
a b c d e f h j k l m n o p q r s t a b c d e f h j k l p q r s t
a b c d e f h j k l m n o p q r s t Inversion a b c d e f h j k l q p o n m r s t
Duplication
a b c d e f h j k l m n o p q r s t a b c d e c d e f h j k l m n o p q r s t Δ m n o
intrachromosomique
a b c d e f h j k l m n o p q r s t z w k c d e v y x g i u …
interchromosomique
Nouvelles jonctions, possibilité d'altération ou de fusion de gènes
Réarrangements chromosomiques
(suite)z w k l m n v y x g i u ….
interchromosomique
Translocation simple
a b c d e f h j k l m n o p q r s t a b c d n m l e f h j k o p q r s t
intrachromosomique
a b c d e f h j k o p q r s t
a b c d e f h j k l m n o p q r s t
interchromosomique
Translocation réciproque
intrachromosomique
t r s q d e f h j k l m n o p c b a
a b c d e f h j k l m n o p v k w z t s r q y x g i u …
Duplication des gènes et conséquences
Gène ancestral
Un génome n'est qu'un instantané d'un processus continuel de duplication et perte de gènes au cours des générations successives.
Susumu Ohno, 1970
mutations
Copies paralogues
Nouvelle fonction:
néo-fonctionalisation paralogues
Copies paralogues Gène
ancestral
Spécialisation des fonctions:
sub-fonctionalisation paralogues
Gène ancestral
X
Copies paralogues
Perte d'une copie:
non-fonctionalisation
Perte de gènes
Délétion: un seul gène ou quelques gènes adjacents
Dégénérescence mutationelle:
formation de pseudogènes
Trios parents-enfant normaux:
Génotypage SNP
Comparaison avec carte HapMap CGH sur tiling-arrays
--> dans la population humaine, chaque individu porte dans son génome 30-50 délétions de plus de 5kb à l'état hémizygote (total de 550 -750 kb manquant)
Intrachromosomique
Interchromosomique
Duplications segmentaires
Instable au cours des générations ultérieures
Stable au cours des générations ultérieures
unassembled sequence reads
interchromosomique intrachromosomique
Example: rat
Total duplications segmentaires récentes:
2.9 % du génome (rat) 1-2% du génome (souris) 5-6% du génome (homme)
Lachancea thermotolerans
Kluyveromyces lactis Saccharomyces cerevisiae
Candida glabrata
Zygosaccharomyces rouxii Saccharomyces castellii
Eremothecium gossypii Vanderwaltozyma polymorpha Duplication
du génome
Duplication totale du génome: exemple de la levure
Double synténie
Mewes et al. Nature (1997) 387 suppl: 7-65
régions dupliquées imparfaites
Wolfe and Shields (1997) Nature 387, 708–713
Duplication suivie de délétions nombreuses (90 % chez S. cerevisiae, 95 % chez C. glabrata)
Tetraodon negroviridis
Duplication totale du
génome
Hypothèse des 2R
DUPLICATION TOTALE DU GENOME (TETRAODON)
Jaillon et al. 2004 Nature 431: 946-957
Blocs de synténie appariés deux à deux
Double synténie (homme-Tetraodon)
DUPLICATION TOTALE DU GENOME (TETRAODON)
Aury et al., (2006) Nature 444: 171-178
Paramecium tetraurelia
49 000 gènes
DUPLICATIONS TOTALES SUCCESSIVES DU GENOME (PARAMECIE)
25 000 gènes 13 000 gènes 7 000 gènes ?
CONSEQUENCES DES DUPLICATIONS DE GENOME
Polyploïdie intégrale (initiale)
Perte des gènes dupliqués Déséquilibre du dosage génique
Divergence des séquences (asymétrie: une copie reste proche de la copie ancestrale, l'autre diverge vite en séquence et/ou régulation)
Réarrangement massif des cartes génétiques
Incompatibilité génétique et spéciation
Les surprises des ARN
micro ARNs
2002 Caenorhabditis elegans
D. Baltimore R. Dulbecco H. M. Temin
Transcription réverse
1970 Chicken virus
cDNA RNA gene
retrogene
Richard J. RobertsPhilip A. Sharp
introns
1977 Mammalian virus, rabbit globin gene Intron Intron
Precursor RNA mRNA
+
retrotransposons
1985 yeast
Jef D. Boeke mobile
element RNA cDNA
mobile element
Interférence ARN
early 1980
then 2000 petunias, fungi, Caenorhabditis elegans
Andrew Z. Fire Craig C. Mello Sydney AltmanThomas R. Cech
Catalyse par l'ARN Edition de l'ARN
1983 Tetrahymena nuclear intron, E. coli RNAse P Trypanosoma RNA novel RNA sequence
ADN
ARN
Protéine Transcription
Traduction Réplication
1970-1980
Transcription reverse
Epissage Edition
1953-1961
ARN
Protéine
Réplication
Transcription
Traduction
ADN
Le dogme central de la biologie moléculaire
Gène
Fonction
ADN Gène
ARN précurseur transcrit du gène
Intron 2 Intron 3 Intron 1
Exon 1 Exon 2 Exon 3 Exon 4
Qu'est-ce qu'un gène ? Epissage des ARNs
protéine
dégradation
+
Introns excisés Phase codanteJonctions des exons
régulation
5' UTR 3' UTR
ARN épissé
Deux classes de mécanismes de transposition
reconnaît les
«pieds du transposon»
Transposase
1- choisit un site dans le génome 2- coupe les deux brins de l’ADN 3- insère le transposon excisé ou sa copie ADN
ARN
ADN
ARN Transcriptase
inverse Intégrase reconnaît les extrémités de l'ADNc ADNc
copie l'ARN en ADN
1- choisit un site dans le génome 2- coupe les deux brins de l’ADN 3- insère l'ADNc
Rétrotransposon
McClintock, B. 1951 Cold Spring Harbor Symp. Quant. Biol. 16: 13-57 Eléments de contrôle du maïs (élément Ac pour activateur).
3 ’
5 ’ ARN transcrit
AAAAAAAA 3 ’
5 ’ ARN maturé
4 introns, 5 exons
3,5 kb 4,6 kb
CAGGGATGAAA TTTCATCCCTA
répétitions terminales inversées imparfaites (pieds du transposon )
Transposase
Exemple historique de transposon
gag pol
protéase, intégrase transcriptase inverse
LTR LTR
décalage +1 de cadre de lecture
6 kb
Transposon de levure (élément Ty1 pour transposon of yeast)
Exemple historique de transposon
Boeke, J. D. et al. 1985. Cell 40: 491-500
AAAAAAAA 3 ’
5 ’ ARN transcrit
Transcriptase inverse Intégrase GAG
polyprotéine protéase
Eléments de classe I actifs dans le génome humain
Mills et al., 2007 Trends in Genetics 23: 183-191
TSD: target site duplication
SINE 7SL
LINE
LTR
Modèle de retrotransposition des éléments Alu
La fixation de l’ ARN Alu sur le ribosome en train de traduire l’ORF2 de l’élément LINE L1 lui permet de capturer la protéine naissante ORF2p. ==> La transcription inverse est initiée sur l’ARN Alu et non plus sur l’ARN LINE L1.
On pense que la fixation se ferait par l’intermédiaire d’interactions avec SRP9p-SRP14p (tache jaune) comme pour l’ARN 7SL (car Alu en dérive).
L’ARN SVA (orange) se comporterait de même manière.
Conséquences de l’activité des éléments mobiles sur le génome et l'expression des gènes
➥ activation de l ʼexpression dʼun gène voisin (ex. certaines tumeurs)
➥ induction de cassures chromosomiques (ex. les transposons non duplicatifs laissent des cicatrices)
➥ dysgénèse hybride (ex. deux lignées de Drosophile qui diffèrent par leur lot de transposons P ou I ne peuvent plus se croiser entre elles, formation d ʼespèces nouvelles)
➥ induction de réarrangements chromosomiques (ex. translocations réciproques entre copies du même élément, cascades de « ponts cassures - fusions »)
➥ inactivation dʼun gène (exemple historique: le mutant white de la Drosophile) ex. d ʼinsertions délétères de l ʼélément LINE-1:
gène du facteur VIII: naissance de garçons hémophiles (le gène est sur le chromosome X) gène APC: cancer du colon
gène de la dystrophine: myopathies
Exon shuffling
~ 19 % des exons des génomes eucaryotes proviennent de ce processus
exon
Exon 1IntronExon 2
nouvel exon
Nouvel épissage ou perte de l'intron
~ 4 % des nouveaux exons du génome humain proviennent de ce processus
Insertion d'un élément mobile
élement mobile Exon 1IntronExon 2
Formation de nouveaux sites d'épissage ou perte des introns
Nouvel exon
Formation de rétrogènes
1 % des gènes humains, plus de nombreux pseudogènes, sont issus de ce processus
ADNc
rétrogene
fusion de gène ou ARN gène ancestral
Conséquences de l’activité des éléments mobiles sur l'évolution des génomes
Exemple d'exon shuffling
Long and Langley (1993) Science 260: 91-95 Long et al. (2003) Nature Genetics Reviews 4: 865- 875
Exonisation d'éléments mobiles
Gène humain RPE2-11 2 3 4 5 6
3' UTR
5' UTR Alu J
exon 3
Partie de séquence Alu J devenant un exon codant intron
Ribulose-5-phosphate-3-épimerase
Saguinus
Lemur Eulemur Tarsius Saimiri Macaca Colobus Hylobates Pongo Pan Homo Réversion
Alu J insertion / fixation Alu J exonisation Strep
sirrhini Tarsioidea
Platyrrhini
Cercopithecoidea Hominoidea
ca. 10 MYr
Mutations au site 3' d'épissage Krull et al., (2005) Mol. Biol. Evol. 22, 1702-1711
Formation de rétrogènes chez la levure
Nuclear export
XX ∆
Nucleus
Accidental encapsidation of mRNA Template switching of RT Nuclear import
Cytoplasm
Ty1 and URA2 mRNAs
XX ∆
mRNA Schacherer et al., (2004) Genome Res. 14: 1291-1297
[ATCase - ] [ATCase + ] Gal promoter Ty Substrate relative freq.
revertants
Glucose OFF 1
Galactose ON 1000
X non-sense mutation
∆ deletion with frameshift XX ∆
ATCase URA2 15-30-72
Génomes riches et pauvres en capacité d'innovation
levure homme
Gènes (codant des protéines) 5 770 ~ 23 000
Introns 280 > 100 000
Pseudogènes 10 > 25 000
Éléments mobiles ~ 50 > 1 100 000
Nombre de familles de protéines ~ 4 100 ~10 000 Redondance (gènes paralogues) 1,4 x 2,3 x
Exons codants Introns, UTR, pseudogènes Eléments mobiles Autres régions
régulations évolution fonctions
Le génome et son évolution 1953
RNA
Protéine
Réplication
Transcription
Traduction
ADN
2009
ADN
ARN
ProtéineS
Transcription multiple
Traduction (code génétique)
Réplication
Transcription réverse
Epissage Edition Régulation Evolution
Origine des gènes Epigénèse GenBank
EMBL
UniProt
Le dogme central de la biologie moléculaire
ADN
ARN
Protéine
Transcription
Traduction (code génétique)
Réplication
1970-1980
Transcription réverse
Epissage Edition