• Aucun résultat trouvé

Evolution moléculaire: aspects choisis

N/A
N/A
Protected

Academic year: 2022

Partager "Evolution moléculaire: aspects choisis"

Copied!
47
0
0

Texte intégral

(1)

Evolution moléculaire: aspects choisis

Plasticité du génome: chromosomes et gènes Plasticité et évolution des protéines

Evolution dirigée: exemples d'ingénierie du code génétique

(2)

Sur les échelles de temps courtes, la diversité génétique 

provient du brassage de chromosomes via reproduction sexuée

Combien avons­nous  d'ancêtres au temps de  Charlemagne?

(3)

Un monde sans évolution: équilibre de Hardy­Weinberg

       Femelle

A a allèle

p q fréquence

a   q Aa aa

pq q2

A  p AA Aa

p2 pq

eâlM Génotypes de la 

descendance et  leurs fréquences

En effet: fréquences dans les gamètes filles: A: p' = p2 + pq = p   a: q' = 1­p' = q Fréquences inchangées (normal: pool de gamètes constant). Idem pour n>2 allèles

La variabilité génétique de la population reste inchangée.

Organismes diploides, pas de mutations ni sélection, population infinie, “panmictique”

Ces valeurs 

sont inchangées  au fil des 

générations

(4)

Synténie Homo sapiens – Mus musculus

Brassage de fragments chromosomaux: la synténie

Notion de “synténie”

= sur le même ruban

100 Ma

(5)

Chromosome II humain

Weinberg et al, Chrom Res (1994) 2:405

Brassage de fragments chromosomaux: la synténie

Chromosomes homologues de chimpanzee Notion de “synténie”

= sur le même ruban

6 Ma

“Translocations chromosomales”

(6)

Chromosomes humains

Synténie Homo sapiens – Poisson zèbre

(7)

Des accidents cellulaires ou chromosomiques majeurs possibles: 

duplications, divisions interrompues

Nature (2004) 617:428

Duplication complète du génome de levure

Anomalies des chromosomes sexuels,  trisomie

(8)

Recombinaison homologue (ou non)

Chromosomes  méiotiques (métaphase)

Chen et al, Nature Reviews  Genetics 8, 762­775 (2007)

(9)

Co­occurrence de gènes: phylogénie

La présence/absence/localisation de gènes est caractéristique d'une espèce Exemple: protéines présentes dans les 3 “domaines” du vivant, 

eucaryotes, eubactéries, archées: issues de LUCA?

Nombre de gènes

Protéines ribosomales 30

Aminoacyl ARNt synthétases 15

Facteurs de traduction 6

Enzymes de mofification de l'ARN et des protéines 3 Consituants de la Signal Recognition Particle (sécrétion) 3

Protéine chaperone/protéase 1

Sous­unités de l'ARN polymérase 3

Facteurs de processivité des ADN polymérases 3 Topoisomérase IA, recombinase, Rad50/Mre11 4

ATP synthétases 2

TOTAL 70

Traduction, fonctions associées

Transcription Réplication Réparation  Métabolisme

(10)

Co­occurrence de gènes: prédiction de fonction

Soit les gènes d'un certain sous­ensemble  sont tous présents dans un génome,

soit ils sont tous absents : on ne trouve pas  l'un sans les autres   lien fonctionnel→

Inférer gènes liés fonctionnellement.

Exemple: reconstruction de voies  métaboliques ou de signalisation.

De plus: la proximité génomique est  corrélée à l'interaction physique entre les  protéines.

Pellegrini (2001) Curr Opin Chem Biol

(11)

Éléments génétiques mobiles

Transposons (Barbara McClintock, prix Nobel 1983)

Retrovirus     (David Baltimore, découverte de la transcriptase inverse) INterspersed Elements: SINE/LINE

La plupart des séquences “répétées” de notre 

génome proviennent d'éléments génétiques mobiles

(12)

VIH­1: un rétrovirus

­génome ARNsb diploïde

­copié par une transcriptase inverse (RT)

(13)

http://www.hiv.lanl.gov    HIV sequence database

VIH­1: un rétrovirus

­génome ARNsb diploïde

­certains gènes sont épissés 

­recouvrement partiel de gènes

­copié par une transcriptase inverse (RT)

­la RT utilise comme amorce une ARNt

­présence dans la particule virale de protéines et  ARN nécessaires pour démarrer son cycle de vie

­la RT est peu fidèle: mutations

­elle a trois activités: ADN polymérase, ARN  polymérase, Rnase

(14)

Transcription inverse: modèle naïf

­génome ARNsb diploïde

­copié par une transcriptase inverse (RT)

­la RT utilise comme amorce une ARNt

­la RT a trois activités:

ARN polymérase, ADN polymérase, RNase

RT 3'

ARN génomique viral ARNt(Lys)

3' ARN génomique viral ADN complémentaire dégradation de l'ARN ADN

ADN double brin

Quel est le problème posé par ce modèle?

(15)

A AATxxxxxxxGxx

xxxxTTGACAxxxxxxxxxxxxxxxxxTAT xxxxxxx xxxxAACTGTxxxxxxxxxxxxxxxxxATA xxxxxxx TTAxxxxxxxTxx

C

Start of

transcription Local fusion

Of the DNA

“­35”

sequence

“­10”

sequence

Transcribed strand Spectator strand

Purine

3 regions upstream of the START site allow RNA polymerase 2  binding and the initiation of transcription of an ORF (open reading  frame): they form the promoter.

Un élément génétique mobile doit soit être toujours inséré 

près d'un promoteur endogène, soit pouvoir  emporter  son 

propre promoteur lors de sa transcription: comment faire?

(16)

Transcription inverse: modèle détaillé

U3 contient le promoteur.

Notez la répétition de R.

L'ARNt sert d'amorce pour la RT

Le brin ADN­ (rouge) se dissocie et se  réassocie côté 3' via le 2ème R (ou  s'associe à l'autre ARN viral)

Extension ADN­ et digestion ARN+ PP = segment polypurine résistant,  non­digéré à ce stade

PP sert d'amorce pour synthèse du brin  ADN+ bleu, puis est digéré

Circularisation du brin rouge via  PB:PB'; extension du brin bleu,  jusqu'au bout du brin rouge

Après intégration dans le génome hôte,  notez la position et le dédoublement des  promoteurs (U3) et du LTR = “Long  Terminal Repeat”

(Y Gaudin, Bio451, Fig 14.14)

ARNviral

ADNdb

(17)

Site d'intégration (AA)

– TATAAA – 

– AATAAA –  Promoteur

Signal de polyadénylation

d'initiationSite

Future coiffe

Sited'intégration (TT)

Site de terminaison poly­A

Séquence répétée

R U5

U3

Séquence répétée

gag      pol       env

LTR LTR

Structure détaillée du “Long Terminal Repeat”

cf http://www.hiv.lanl.gov  

(18)

Que se passe­t­il si on  perd l'activité env? 

Wikimedia Commons

(19)

Des éléments génétiques mobiles: les transposons 

gag        pol LTR

Ci­dessous: un retrotransposon: Presqu'un rétrovirus; pas de gène env

Plusieurs types; eg LINEs (Long INterspersed repetitive Elements):

­6­8 kbases

­produisent des copies d'eux­mêmes: expansion du génome

­500,000 exemplaires dans notre génome: 17% du génome

SINES (Short etc): 1,500,000 dans notre génome (11% du génome) Transposons = 50% du génome du maïs

Mécanisme copier/coller ou couper/coller ( transposase)← Nombreuses applications en biotechnologie

Effets biologiques, eg via leur 2ème promoteur (LTR de droite): oncogènes Ne pas confondre avec les séquences mini­ ou microsatellites

LTR

(20)

Un SINE de ~300 nt, qui descend d'un petit ARN ribosomal: 7SL

L'élément répété le plus abondant de notre génome (10copies = 11%!) Transcrit par l'ARN Polymérase III, qui utilise un promoteur interne Ne code pour aucune protéine; utilise les protéines cellulaires

Nature (2011)  469:529

Un exemple de “Small INterspersed Element”: les séquences Alu

Énorme expansion  humaine récente; 

aujourd'hui inactif 284 nt

(21)

Séquences “répétées”

nématode drosophile humain Pseudogènes 

LINE/SINE 0.4% 5% 28%

Séquences 0% 6% 8%

rétrovirales

Transposons 5% 4% 3%

Total 7% 15% 39%

ADN satellite dans le centromère

répétition d'une séquence courte (10­100 nt)

Minisatellites répétition d'une séquence courte (10­100 nt); ~1 kb chacun

~1000 dans notre génome; souvent télomériques Microsatellites  motif de 1­10 nt, répété 10­100 fois; 

répartition assez uniforme   marqueurs/carte physique→

polymorphisme (nb de répétitions) génotypage, phylogénie→ Éléments “dispersés” 

ou “interspersed”; 

origine virale

A Bernot, Analyse de Génomes (2001)

(22)

Séquences “répétées”

nématode drosophile humain

LINE/SINE 0.4% 5% 28%

Séquences 0% 6% 7%

rétrovirales

Transposons 5% 4% 3%

Taille du génome (Mb)

Nombre de transposons

Présence de transposons  à partir d'une certaine  taille du génome

nombre

fraction du génome

(23)

Séquences “répétées”

nématode drosophile humain

LINE/SINE 0.4% 5% 28%

Séquences 0% 6% 8%

rétrovirales

Transposons 5% 4% 3%

Taille du génome (Mb)

Nombre de transposons Taille 

moyenne  (nt)

nombre  moyen  par gène

Présence/taille d'introns

Lynch, Science '03 nombre

fraction du génome

(24)

Des accidents cellulaires ou chromosomiques majeurs possibles: 

duplications, divisions interrompues, phagocytose/endosymbiose

Nature (2004) 617:428

Duplication complète du génome de levure

Anomalies des chromosomes sexuels,  trisomie

la mitochondrie:

endosymbiose   →

“transfert” de gènes

(25)

Arbre de la vie, ou cercle?

 

Le premier eucaryote est peut­être apparu par

fusion/symbiose d'une eubactérie et d'une archébactérie.

eucaryote

eubactérie

archébactérie Ancêtre

commun Ernst Mayr, What Evolution Is (2001) Fig 3.2

(26)

Arbre de la vie: une vue moderne

La structure hiérarchique de l'arbre modélise les spéciations successives.

(27)

Evolution moléculaire: aspects choisis

Plasticité du génome: chromosomes et gènes Plasticité et évolution des protéines

Evolution dirigée: l'exemple des aminoacyl­ARNt synthétases

(28)

Des peptides aléatoires peuvent se replier et être fonctionnels

Parmi une librairie de  séquences aléatoires,  de longueur ~80 aa, et  principalement 

composées de R, Q, L,  5% se replient 

(faiblement);

PNAS (1994) 91:2146

Parmi une librairie de  1013 séquences, de  longueur ~100 aa,

~10 fixent une protéine: 

la streptavidine;

Szostak et coll

PNAS (2001) 98:3750

(29)

Des peptides aléatoires peuvent se replier et être fonctionnels

Parmi une librairie de  séquences aléatoires,  de longueur ~80 aa, et  principalement 

composées de R, Q, L,  5% se replient 

(faiblement);

PNAS (1994) 91:2146

Parmi une librairie de  1013 séquences, de  longueur ~100 aa,

~10 fixent une protéine: 

la streptavidine;

Szostak et coll

PNAS (2001) 98:3750

Science (2003) 302:1364

Top7

Une protéine artificielle

(30)

Des peptides simples peuvent se replier et être fonctionnels

couverture

rms Repliement d'homopolypeptides:

génération in silico de conformations compactes qui  établissent de nombreuses liaisons hydrogènes:

83% sont proches d'une structure de la PDB

Inversement, les structures de la PDB ont généralement  un homologue structurale chez ces homopolypetides.

La plupart des domaines naturels semblent connus.

Les plis naturels semblent émerger de considérations  simples de compacité, hydrophobicité, et satisfaction des  liaisons hydrogènes.      PNAS (2006) 103:2065

(31)

Classe 

Classe 

Classe 

100 superfamilles

= 60% des domaines

L'espace des plis est discret et fini

(32)

Le domaine comme unité de l'évolution 

Aspartyl­ARNt synthétase de levure Aspartyl­ARNt synthétase

d'E coli

Tyrosine kinase c­Src

“SH3” domain: 

found in >150  proteins of  known  structure. 23 in  yeast alone.

(33)

deuxchromosomes mésappariés recombinaison homologue

expansion/

contraction  du motif ou  domaine

Un mécanisme pour ajouter/enlever un motif, gène, ou domaine

(34)

Les mutations ponctuelles

Altérations chimiques spontanées de l'ADN

oxidation/désamination (eg, Cyt   Ura, 100/jour/cellule) autres dommages oxidatifs (via superoxide, peroxide) méthylation (change les appariements; provoque G   A) Erreurs de l'ADN polymérase

favorisées par des molécules chimiques exogènes (et mutagènes),  eg, intercalants dans l'ADN (benzène, ...)

Rayonnements ionisants

UV, rayons X   dimérisation de pyrimidines Systèmes de protection simples ou sophistiquées

ADNdb, diploïdie

redondance/robustesse du code génétique systèmes de réparation de l'ADN

systèmes de protection anti­oxidants,

dont l'ADN non­codant (pouvoir réducteur)

Les mutations peuvent être délétères, neutres, ou avantageuses

(35)

The origins, determinants and consequences of human mutations

Shendure & Akey, Science 2015

60 mutations ponctuelles apparues dans les cellules germinales de nos  parents et héritées par nous

1011 mutations germinales apparues dans  la dernière génération humaine

Environ 10­8 mutations par base et par génération

Mutations somatiques dans les tissus les plus prolifératives: à 60 ans,  environ une mutation à chaque site du génome dans une cellule au moins Mutations silencieuses ou non...  (comparer Homo sapiens/chimpanzee) 1000 Genome Project      http://browsers.1000genomes.org/index.html  Cancer Genome Project       http://www.sanger.ac.uk/genetics/CGP

paternelAge 

Nombrde mutations

(36)

Taux de mutation ponctuelle dans quelques protéines

Molecular Evolution;

Page, Holmes; 1998

Chave, Biodiversité, 2009

(37)

Mutations synonymes ou non, neutres, délétères, ou avantageuses

Hypothèse: 

­les mutations synonymes sont neutres

­les mutations non­synonymes servent principalement à éliminer  des variants délétères (sélection négative)

­l'absence de mutations non­synonymes indique une contrainte  fonctionnelle (sélection positive)

Alors: 

nombre de mutations non­synonymes

nombre de mutations synonymes  indicateur de

pression sélective

=

Sélection positive Sélection

négative Pas de sélection

Monget p299

(38)

L'évolution choisie:

évolution dirigée et ingénierie du code génétique

(39)

Anticodon

Acide aminé

-

GUC

CAG ARNm

Aminoacyl-

ARNt synthétase

“Evolution dirigée” et extension du code génétique:

Ingénierie d'un couple ARNt­aminoacyl­ARNt synthétase

appariement sur le ribosome

(40)

Anticodon

Acide aminé-

CUA

TAG ARNm

Aminoacyl-

ARNt synthétase mutée

suppression de codons STOP

Evolution dirigée et extension du code génétique: création d'un nouveau couple ARNt – aminoacyl­ARNt synthétase

L'ARNt muté va pouvoir “supprimer” des codons STOP L'enzyme muté ne peut interagir qu'avec cet ARNt.

ARNt muté

(41)

Evolution dirigée et extension du code génétique

TyrRSMj(muté)

Gène CAT(muté):

résistance au chloramphenicol

TyrARNtMj(muté)

Plasmide 1

+

Plasmide 2

Bibliothèque de mutants aléatoires

Si la TyrRS mutée est capable d'aminoacyler l'ARNt muté avec un acide  aminé (Tyr ou autre), alors l'ARNt va pouvoir supprimer un codon STOP  qu'on a inséré au milieu du gène CAT: possibilité de sélection.

TAG

(42)

Evolution dirigée et extension du code génétique

TyrRSMj(muté)

Gène CAT(muté)

TyrARNtMj(muté)

Plasmide 1

+

Plasmide 2

Bibliothèque de mutants

E. coli

+ aa X

+ antibiotique

(43)

Evolution dirigée et extension du code génétique

TyrRSMj(muté)

Gène CAT(muté)

TyrARNtMj(muté)

Plasmide 1

+

Plasmide 2

Bibliothèque de mutants

E. coli

Sélection des survivants + aa X

+ antibiotique

Enzyme, ARNt compétents pour X

OU Tyr

(44)

Evolution dirigée et extension du code génétique

TyrRSMj(muté)

Gène CAT(muté)

TyrARNtMj(muté)

Plasmide 1

+

Plasmide 2

E. coli

Bibliothèque de mutants

Sélection des survivants + aa X

+ antibiotique

Enzyme, ARNt compétents pour X

OU Tyr

E. coli

­ aa X

+ antibiotique Enzyme, ARNt

compétents pour X mais pas Tyr

Sélection des NON survivants

(45)

X peut être un acide aminé non­naturel!

Evolution dirigée et extension du code génétique

Activé par photons Réactif:

modifications  chimiques de 

protéines

Atome lourd (I)   résolution de 

structures  cristallograhiques

Codage de X par un codon TAG dans un gène choisi.

Il faut ajouter à la bactérie une voie métabolique pour synthétiser X.

On peut aussi développer des ribosomes mutants spécialisés. 

(46)

E coli sans codon stop Ambre UAG codon rare dans E coli

élimination de l'ARNt “suppresseur” qui le reconnait apport de quelques gènes sur plasmide

réutilisation de UAG comme nouveau codon sens Nucleic Acids Research (2010) 38:8188

Evolution dirigée et extension du code génétique

Les 20 aa habituels  avec leur 61 codons

+

 

un codon STOP  reconverti et utilisé  pour coder la méthyl­

tyrosine = 21ème aa

(47)

Sequence, evolution, function. Koonin, Galperin; Kluwer, 2003 Molecular evolution. Page, Holmes; Blackwell, 1998

Fundamentals of molecular evolution. Li, Gaur; Sinauer, 1991 Biodiversité, Jérôme Chave, Ecole Polytechnique; 2009 et 2010

“Des virus ont­ils inventé l'ADN?” P Forterre, Pour la Science, 2008

“Tant va l'autruche à l'eau qu'à la fin elle se palme” (R Queneau)

Références

Documents relatifs

[r]

[r]

[r]

Pour obtenir des majorations explicites, plusieurs r´ esultats effectifs de g´ eom´ etrie arithm´ etrique sont d´ evelopp´ es ou adapt´ es dans le cadre de la g´ eom´

Si on dispose du tableau des p`eres, il est facile de trouver un plus court chemin ; si on n’a pas ce tableau ou si on recherche tous les plus courts chemins, on proc`ede de la

Chez la plante Arabidopsis thaliana, le gène TX codant pour une enzyme de détoxification d’un métal lourd, le cadmium, a été séquencé chez 6 individus dans 2

A command file always contains a header, two program segments (a text segment and an initialized data segment), and optionally contains a symbol table and relocation information..

L’apparition  de  l’appareil  reproducteur  floral  est  une  innovation  majeure  dans  l’évolution  des  végétaux.  Le  facteur  de  transcription  APETALA3