RETRACER L’ÉVOLUTION DES GÈNES
N A D I A E L - M A B R O U K
Le dogme central de la biologie moléculaire
Replication
Transcription Translation
www. Bioalgorithms.info
L’ADN
• ADN: Séquence de 4 nucléotides
– Purines: Adénine (A), Guanine (G)
– Pyrimidines: Cytosine (C ), Thymine (T)
gcacaaattgttactgaaatagttgagattgtagttataagagtttagtgcgaagcctttggcagtaatgcttactacg tatttgctaaagtaactataatctttgaggaattagaagtagctatgtccttgttatcagttcaatgatatagctaattat tgtatttagcagcaacggtataatgatctgttaatacttaatatgatagagagtggttgttgtgaattgcatagtgtgat atggtcatgtttagcgcaatcaggaagtgtaatattcttcgctcattaataaataagtggattatagaaggcatattga cttatggacggattacttaccgggtgagaaatttgaagtggaatatgcccaatatttatactaataccgatctagtcag attgagaaatgttctaactgtatcattgctaagaattacttactataagtctaaatatcttgttgtatggggggtggtctt tcccctaccaatagtaaatgtaaatctagctcaatttggctttattgtcttgttaaatccgtaattagttaatatggtggt attaaagttacaatattgactaataccgatctaactataatctttgaggaattagaagtagcggccggtatgtccttgtt atcagttcaatgatatagctaattaaccgatctaactataatctttgaggaattagagattagggggsgacagcgttgt ttggacacaacaagtagctatgtccttgttatcagttcaatgatatagctaattaaccgatctaactataatctttgagg aattagaagtagctat
L’ADN
• Gène: Partie transcrite en ARN messager, puis traduit en protéine.
gcacaaattgttactgaaatagttgagattgtagttataagagtttagtgcgaagcctttggcagtaatgcttactacg tatttgctaaagtaactataatctttgaggaattagaagtagctatgtccttgttatcagttcaatgatatagctaattat tgtatttagcagcaacggtataatgatctgttaatacttaatatgatagagagtggttgttgtgaattgcatagtgtgat ATGgtcatgtttagcgcaatcaggaagtgtaatattcttcgctcattaataaataagtggattatagaaggc atattgacttatggacggattacttaccgggtgagaaatttgaagtggaatatgcccaatatttatactaata ccgatctagtcagattgagaaatgttctaactgtatcattgctaagaattacttactataagtctaaatatctt gttgtatggggggtggtctttcccctaccaatagtaaatgtaaatctagctcaatttggctttattgtcttgtta aatccgtaattagttaatatggtggtattaaagttacaatatTGActaataccgatctaactataatctttgagg aattagaagtagcggccggtatgtccttgttatcagttcaatgatatagctaattaaccgatctaactataatctttgag gaattagagattagggggsgacagcgttgtttggacacaacaagtagctatgtccttgttatcagttcaatgatatag ctaattaaccgatctaactataatctttgaggaattagaagtagctat
ATG gtc atg ttt agc gca atc agg aag tgt aat att ctt cgc tca tta ata aat aag tgg att ata gaa ggc ata ttg act tat gga cgg att act tac cgg gtg aga aat ttg aag tgg aat atg ccc aat att tat act aat acc gat cta gtc aga ttg aga aat gtt cta act gta tca ttg cta aga att act tac tat aag tct aaa tat ctt gtt gta tgg ggg gtg gtc ttt ccc cta cca ata gta aat gta aat cta gct caa ttt ggc ttt att gtc ttg tta aat ccg taa tta gtt aat atg gtg gta tta aag tta caa tat TGA
L’ADN
• Gène: Cadre de lecture d’un codon « start » à un codon « stop », où chaque triplet (codon)
correspond à un acide aminé
ATG gtc atg ttt agc gca atc agg aag tgt aat att ctt cgc tca tta ata aat aag tgg att ata gaa ggc ata ttg act tat gga cgg att act tac cgg gtg aga aat ttg aag tgg aat atg ccc aat att tat act aat acc gat cta gtc aga ttg aga aat gtt cta act gta tca ttg cta aga att act tac tat aag tct aaa tat ctt gtt gta tgg ggg gtg gtc ttt ccc cta cca ata gta aat gta aat cta gct caa ttt ggc ttt att gtc ttg tta aat ccg taa tta gtt aat atg gtg gta tta aag tta caa tat TGA
…. Val Met Phe Ser Ala Ile Arg Lys Cys Asn …
+a -b -c +d +e -f -g
Familles de gènes
G
1 a1 b1 c1 a’1 d1 e1 f1 g1 h1 d’1 d’’1e2 h2
G
2G
3G
4a2 b2 c2 a’2 d2 f2 d’2 g2
a3
a4
b3
b4 d3 f3 e3 d’3 a’3 c3 d’’3 h3 g3
i2
d4 f4 e4 d’4 e’4 d’’4 a’4 c4 c'4 a’’4 g4
Familles de gènes
G
1 a1 a’1G
2G
3G
4a2 a’2
a3
a4
a’3
a’
?
4 a’’4Familles de gènes
Exemple: RPGR Retinitis
pigmentosa GTPase regulator Joue un rôle dans la coloration des yeux.
Presque tous les vertébrés en ont une copie, certains plus d’une, certains n’en ont pas.
Super-mammal
Super-primate
Super-rodent
Mouse Rat Human
Orangutan Gibbon
Humanutan
G O, O’ H M R, R’
Arbre de gènes
G O
M H R R’
O’
R R’
M O O’
H G
Réconciliation
Extension de l’arbre de gènes reflétant une histoire évolutive par spéciations, duplications et pertes en accord avec l’arbre d’espèces.
Réconciliation
Réconciliation par LCA: minimise duplications+pertes.
Arbre de gènes étiqueté
Noeuds étiquetés duplication ou spéciation.
Super-mammal
Super-primate
Super-rodent Humanutan
Mouse Human
Orangutan
Gibbon Rat
RPGR
Super-mammal
Super-primate
Super-rodent
Mouse Human
Orangutan Gibbon
Humanutan
Rat
RPGR
RPGR1 RPGR2
Super-mammal
Super-primate
Super-rodent Humanutan
Duplication = gene creates a copy in its species
Mouse Human
Orangutan
Gibbon Rat
RPGR
RPGR2
Super-mammal
Super-primate
Super-rodent Humanutan
Speciation = gene
"splits" into two descending species
Mouse Human
Orangutan Gibbon
RPGR1
Rat
RPGR
RPGR2
Super-mammal
Super-primate
Super-rodent Humanutan
Mouse Human
Orangutan Gibbon
RPGR1
Rat
RPGR
RPGR2
Super-mammal
Super-primate
Super-rodent Humanutan
RPGR1
Mouse Human
Orangutan
Gibbon Rat
RPGR
RPGR2
Super-mammal
Super-primate
Super-rodent Humanutan
Mouse Human
Orangutan Gibbon
RPGR1
Rat
RPGR
RPGR2
Super-mammal
Super-primate
Super-rodent Humanutan
RPGR1
Mouse Human
Orangutan
Gibbon Rat
RPGR
RPGR2
Super-mammal
Super-primate
Super-rodent Humanutan
Mouse Human
Orangutan
Gibbon Rat
RPGR1
RPGR
RPGR2
Super-mammal
Super-primate
Super-rodent Humanutan
Mouse Human
Orangutan Gibbon
RPGR1
Rat
RPGR
RPGR2
G O O’ H M R R’
Duplication Spéciation RPGR1
RPGR
RPGR2
Duplication Spéciation
G O O’ H M R R’
RPGR1
RPGR
RPGR2
O R R’ G O’ H
Duplication Spéciation M
RPGR1
RPGR
RPGR1 RPGR2
Duplication Spéciation
O M R R’ G O’ H
Duplication Speciation
Orthologues: LCA spéciation
O M R R’ G O’ H
Duplication Speciation
O M R R’ G O’ H
Orthologues: LCA spéciation Paralogues: LCA duplication
Pourquoi c’est important?
• Conjecture: Les orthologues ont tendance à être similaires en fonction.
• Certaines banques de données d’annotation
fonctionnelles considèrent cette conjecture ( COG, eggNOG, etc)
• Quest For Orthologs consortium: "a joint effort to benchmark, improve and standardize
orthology predictions through collaboration, the
use of shared reference datasets, and evaluation
of emerging new methods".
Rhazya stricta
• Buisson de la famille des Apocynaceae (dont les
pervenches) qui pousse en zone aride, en particulier en Arabie saoudite.
• Produit des alkaloïdes en réponse au stress dû à des conditions
climatiques difficiles
• Utilisés en chimiothérapie pour le traitement de la leucémie et le lymphome de Hodgkin's.
• Très difficile de répliquer les voies métaboliques produisant ces
composés chimiques en laboratoire.
• Important de retrouver les bonnes copies des gènes.