La synténie :
définition(s), détection, intérêt en
Génomique Comparative et Evolutive
Définition
Groupe de gènes dont le voisinage et l’organisation sont conservés sur plusieurs génomes
Génome A
Génome B
correspondance
co-localisation co-localisation
La synténie se caractérise par 2 types de relations :
• Relation de "co-localisation" (intra génome)
• Relation de "correspondance" (inter génomes)
Co-localisation intra génome
Etre présent sur le même chromosome (définition initiale, notion eucaryote)
Etre voisin sur le chromosome, notion de distance et choix d’un seuil …
Utiliser la position physique (en pb) sur le chromosome ou une numérotation relative à l’ordre des gènes sur le chromosome
NB : pour les génomes circulaires (type bactériens), il faut
« linéariser » le chromosome
Génome A
Génome B
co-localisation co-localisation
correspondance
Co-localisation intra génome
Etre présent sur le même chromosome (notion eucaryote)
Etre voisin sur le chromosome, notion de distance et choix d’un seuil …
Utiliser la position physique (en pb) sur le chromosome ou une numérotation relative à l’ordre des gènes sur le chromosome
NB : pour les génomes circulaires (type bactériens), il faut
« linéariser » le chromosome
Génome A
Génome B
co-localisation co-localisation
correspondance
2
Au niveau nucléique (séquence génomique totale)
Au niveau protéique :
Protéines des gènes orthologues
Protéines des gènes homologues (paralogues + orthologues) Autres critères (classifications fonctionnelles, domaines protéiques partagés, etc.)
Correspondance
inter génomes
Génome AGénome B
co-localisation co-localisation
correspondance
• Annotation : Interaction physique et/ou fonctionnelles (opérons, clusters de gènes)
• Identification des ortologues parmi les homologues
• Etude de la dynamique des génomes : Identification de réarrangements (transpositions, délétions, insertions, inversions, fusions/fissions)
Intérêts
Espèce A Espèce B
A1 A2 A3 A4 A5
B1 B2 B3 B4 B5
… A86 A87 A88 A89 A90 A91 A92
B6 B7
… B234 B235 B236 B237 B238 B239
Intérêts
BDBH, RBH
Duplication/Deletion
Nouveaux genes, annotations Orthologues/Paralogues
Réarrangements chromosomiques Seuil détection
Génome A
Génome B
Réarrangement Fusion Duplication Insertion Inversion
gap <= 2
Rq : Correspondances multiples, différents réarrangements et insertions
exemple
Macro- et micro-synténie
Espèce 1 Espèce 2 Espèce 3 Espèce 4 Espèce 5 Espèce 6 Gène : G1 G2 G3 G4 G5 G6 G7
Microsynténie Macrosynténie
Détection
Dotplot de Génomes complets Dotplot de Génomes complets
4
Dotplot de Génomes complets
Eisen et al., 2000
Dotplot de Génomes complets
Régions conservées
Escherichia coli k12
Bacillus subtilis
Artemis Comparison Tool
E. coli S. typhi S. typhimurium
Artemis Comparison Tool
Neisseria meningitidis serogroup A versus serogroup B
1 4
2 2
4
2 c2
c1 c3 c4 c5 c6 c7 c8
2 1
1
2 c2
c1 c3 c4 c5 c6 c7 c8
2 4
c2
c1 c3 c4 c5 c6 c7 c8
1 1
ccA1 ccA2
ccB1 ccB2 ccB3
gap <= 1 c2
c1 c3 c4 c5 c6 c7 c8
ccA1/ccB1 ccA2/ccB2 ccA2/ccB3
c1 c2c3 c4 c5 c6 c7 c8
Algo « Syntonizer »
Human pathogen
Model organism
Cryotolerant, halotolerant marine yeast Alkane-using yeast S. cerevisiae
C. glabrata
K. lactis D. hansenii Y. lipolytica
gene 1 gene 2 gene 3 gene 4 gene 5 gene 6 gene 7 gene 8 gene 9 gene 10 gene 11 gene 12 gene 13 gene 14 gene 15 gene 16
gene a gene b gene c gene d gene e gene f gene g gene h gene i gene j
Genome 1
G e n o m e 2
gap
r2 synteny blocks 10 inter-comparisons
ADHoRe: Eukaryotic genomes
S.cerevisiae C. glabrata K. lactis D. hansenii
C. glabrata
K. lactis
D. hansenii
Y. lipolytica
S.cerevisiae
C. glabrata
88% of the genomes are conserved within synteny blocks
6 Combinatorics of signed permutations Combinatorics of signed permutations
Quelques exemples
Genome reduction in Buchnera
Moran et al., 2001
Gene loss
X YJR052w YJR053w YJR054w YJR055w YJR057w
YJR056c YJR058c
YML0 51w K. thermotolerans :
YJR052w YML046w
YJR055w YML051w YML049w
K. lactis :
YJR052w YML046w
YJR053w YML048w
YJR052w YJR053w YJR054w YJR055w YJR057w
YJR056c YJR058c YML0
51w YML046w
YML048w YML0
49w
Gene duplication/loss
YJR052w YJR053w YJR054w YJR055w YJR057w
YJR056c YJR058c YML0
51w YML046w
YML048w YML0
49w
DUPLICATION
YJR052w YJR053w YJR054w YJR055w YJR057w
YJR056c YJR058c YML0
51w YML046w
YML048w YML0
49w
Gene duplication/loss
YJR052w YJR053w YJR054w YJR055w YJR057w
YJR056c YJR058c YML0
51w YML046w
YML048w YML0
49w
YJR052w YJR053w YJR054w YJR055w YJR057w
YJR056c YJR058c YML0
51w YML046w
YML048w YML0
49w
RECIPROCAL GENE LOSS
Gene duplication/loss
YML0 51w YML046w
YML048w YML0
49w
YJR052w YJR053w YJR054w YJR055w YJR057w
YJR056c YJR058c
YML047c X
XIII
S. cerevisiae
Gene duplication/loss
8
Double Synteny and Whole Genome Duplication in S. cerevisiae
Dietrich et al., 2004
WGD
segmental duplications gene tandem duplications
LOSS -> sequence degeneration deletion
New functions Gene dosage
Gene order changes and translocations
Pseudogenes and gene relics Speciation
<- DUPLICATION
Double Synteny and Whole Genome Duplication in Tetraodon
Jaillon et al., 2004
Double Synteny and Whole Genome Duplication in Tetraodon
Jaillon et al., 2004 110 Doubly Conserved Synteny Blocks
Double Synteny and Whole Genome Duplication in Tetraodon
Jaillon et al., 2004
Double Synteny and Whole Genome Duplication in S. cerevisiae
Wapinski et al., 2007
# genes
Whole Genome Duplication