Génétique quantitative et évolution Ferme du Moulon, 91190 Gif-sur-Yvette.
Le polymorphisme moléculaire et son exploitation en génétique et biotechnologies
Dominique de Vienne, Université Paris-Sud
devienne@moulon.inra.fr
http://moulon.inra.fr/~ddevienne/UE_EGFM_2016-2017
Le polymorphisme moléculaire
et son exploitation en génétique et biotechnologies
Introduction
Les différents types de polymorphismes moléculaires et leurs répercussions (éventuelles) sur le phénotype
Les marqueurs génétiques La notion de marqueur
Le génotypage (SNP, microsatellites, AFLP)
Utilisation des marqueurs en génétique et génomique Cartes génétiques
Cartographie de gènes à effets quantitatifs
Biol303. EGFM 2016–2017 Cours de Dominique de Vienne Mercredis 5, 12 et 19 octobre 2016, de 8h15 à 10h15
§ Locus, gène, allèle, polymorphisme neutre ou non neutre, dominance, récessivité, codominance, semi-dominance ou additivité.
§ Les marqueurs génétiques et techniques associées (SNP, microsatellites, AFLP)
§ Les principaux types de descendances en ségrégation
§ La cartographie génétique. Notion de taux de recombinaison et de distance génétique.
§ Utilisations des cartes génétiques.
Notions abordées
Variabilité phénotypique
Variabilité phénotypique
Environnement Polymorphisme de séquence
et de structure de l’ADN
« Génotypage » Profils (bandes, pics, etc.)
Sélection naturelle
Quelles sont les bases génomiques de la variabilité phénotypique ? Mutations
Polymorphismes au niveau de l'ADN
G A
1. Single Nucleotide polymorphism (SNP)
transitions ( A G ou C T ) + fréquentes maïs : 1/60 bp
transversions ( A T ou C G ) + rares
2. Insertion-Deletion Polymorphism (IDP ou Indels) maïs : 1/150 bp
dont un cas particulier notoire…
Copy number variation (CNV)
Polymorphisme VNTR (ou microsatellites), « hyperpolymorphe »
Crossing-over inégaux
Variations du nombre de répétitions en tandem d'une séquence
Glissement de la polymérase
CTCTCTCTCTCTCT
GAGAGAGAGAGAGAGAGAGAGAGAGAGAGA
TCTCTCTCTCTCTC CT
C C T C
Allèle 1 Phénotype P1 Allèle 2 Phénotype P2
On ne fait pas de la génétique des caractères, mais des variations des caractères
Du génotype au phénotype
La variation phénotypique peut être discrète (ex. groupes
sanguins, couleur des yeux, etc.) ou continue (taille, poids, etc.)
Du génotype au phénotype
Effet du polymorphisme de l'ADN sur le phénotype
– ADN non-codant => en général pas d'effet, sauf
- action régulatrice sur l'expression (promoteurs)
- rôle dans la dynamique du génome (éléments transposables)
– ADN codant => effet possible seulement, car niveaux emboîtés de dégénérescence :
– dégénérescence du code génétique
– dégénérescence structure primaire => structure secondaire pour les ARNt – acides aminés de même propriétés chimiques
– relation entre flux métabolique et activité des enzymes : non linéaire – fonctions redondantes
Notion de « neutralité » phénotypique et sélective des polymorphismes moléculaires (M. Kimura)
Code génétique Tableau inversé
Genotype : sequence Phenotype :
secondary structure of pairings
Fontana & Schuster, JTB (1998)
Un phénotype, des génotypes
Au niveau de l’ARNt
Génotypes Phénotype
Un phénotype, des génotypes
Au niveau de l’ARNt
Genotype
Phenotype
tRNA Sequence
Secondary structure of pairings
folding
References Fontana & Schuster (1998) Lipman & Wilbur (1991) Ciliberti, Martin & Wagner (2007)
Très souvent, des génotypes différents conduisent à un même phénotype
Protein sequence
Three dimensional structure
Regulatory circuit
Gene expression levels
Un phénotype, des génotypes : autres niveaux
E1 E2 Ej En
X0 S1 … Sj Sj+1 … Xn
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5
0,55 0,6 0,65 0,7 0,75 0,8 0,85 0,9 0,95 1
Paramètre enzymatique
J
J : flux
X : constante Aj = « activité » Ej = concentration
∑
=
j AjEj
J X
1
E b J a
i
+
= 1
Ei
b a J =
Du génotype au phénotype
La relation entre les flux métaboliques et les activité des enzymes n’est pas linéaire.
Notion de « neutralité » phénotypique et sélective des polymorphismes moléculaires (M. Kimura)
Les marqueurs
moléculaires
Notion de marqueur génétique
Marqueur = locus marqueur :
Locus polymorphe (plus d'un allèle dans la population) qui renseigne 1. sur le génotype de l’individu qui le porte
=> génétique des populations, analyses de paternité, études de diversité, protection des variétés
2. sur le génotype d'un ou de locus voisin(s)
=> diagnostic, cartographie de QTL(1), sélection assistée par marqueurs, clonage positionnel
__________________________________
(1) Quantitative trait locus
Types de marqueurs
Marqueurs « à effet visible »
caractère morphologique, de coloration, etc., déterminé par un seul gène (ou gène majeur). Ex. pois lisse / ridé, couleur de fleur monogénique, etc.
Marqueurs « biochimiques »
historiquement : polymorphisme de molécules autres que l 'ADN ex. enzymes (1966), autres protéines, terpènes
Marqueurs « moléculaires »
Polymorphisme de séquence et de structure de l 'ADN
=> presque exclusivement utilisés actuellement, sauf cas particuliers
Les SNP
Les SNP (Single Nucleotide Polymorphisms)
Ø SNP : Site nucléotidique au niveau duquel un polymorphisme de substitution a été observé à une fréquence significative sur un ensemble de
génotypes (2 allèles dans la plupart des cas)
Ø Origine de l'information
- recherche spécifique de SNP sur des régions ciblées - séquençage génomique sur plusieurs génotypes
- Next Generation Sequencing (par rapport à un génome de référence)
G A
Ø Marqueurs nombre quasiment illimité, répartis dans tout le génome (1/60 bp chez le Maïs, 1/1000 bp chez l'Homme)
presque toujours bialléliques
Ø Haut débit d'analyse
Intérêt pour Cartographie génétique
Etudes de diversité / phylogénies Le clonage positionnel
Identification variétale
Les SNP
Intérêt en marquage moléculaire
Ø Séquençage classique : de plus en plus accessible. NGS : Next Generation Sequencing, ou « reséquençage » : comparaison à un génome de référence.
Ø Pas (encore) de méthode universelle
Foisonnement de recherches méthodologiques
Ø Techniques visant le haut débit
robotiser le traitement des échantillons
éviter les étapes longues (électrophorèses,…) faible coût par échantillon
Les SNP
Méthodes de « génotypage »
(= déterminer le génotype aux locus marqueurs)
5'
3' C A Amorce R
Amorce F2
5'
Amorce F1-M13
5'
G
Génotypage SNP par PCR allèle-compétitive
Electrophorèse
Appareil de lecture de fluorescence
C T A G
Position sur la puce quel allèle de quel SNP ?
A C
Produit PCR marqué fluo
Ex. ASOH, allele specific oligonucleotide hybridization Génotypage SNP avec des puces à ADN
Ex. ASOH, allele specific oligonucleotide hybridization Génotypage SNP avec des puces à ADN
Image brute
Analyse d’image
Génotypes Ex. ASOH, allele specific oligonucleotide hybridization
Génotypage SNP avec des puces à ADN
1 Gb sous forme de fragments de 25-35 bases d’ADN génomiques
Génotypage par séquençage. Ex. : méthode Illumina
®« Pelouse » de primers Adaptateurs
Génotypage par séquençage. Méthode Illumina
®PCR
Génotypage par séquençage. Méthode Illumina
®Génotypage par séquençage. Méthode Illumina
®Après dénaturation
Génotypage par séquençage. Méthode Illumina
®A la fin du processus
Nucléotides
fluorescents avec blocage réversible de l’extrémité 3’
Génotypage par séquençage. Méthode Illumina
®Lecture de fluorescence
Déblocage de l’extrémité 3’ des nucléotides et
suppression du fluorochrome Dénaturation et nouveaux cycles
Génotypage par séquençage. Méthode Illumina
®Les microsatellites
§ Répétitions en tandem de motifs mono-, bi-, tri- ou tétranucléotidiques
§ Les plus courants : (A)n, (TC)n, (TAT)n, (GATA)n ….
§ Le nombre de répétitions (n) : de quelques unités à plusieurs dizaines.
Marqueurs microsatellites (SSR)
Eco RI 5'… G AATT C …3' 3'… C TTAA G …5'
Eco RV 5'… GAT ATC …3'
3'… CTA TAG …5' Sau 3A I 5'… GATC …3'
3'… CTAG …5'
Pst I 5'… C TGCA G …3' 3'… G ACGT C …5’
Rappel : la « restriction » enzymatique
*
*
Les enzymes de restriction sont des « ciseaux chimiques » extrêmement spécifiques
Extraction d'ADN Restriction enzymatique Sélect. de taille
Clonage en plasmide
Criblage de la banque : Transfert des colonies et hybridation avec sonde (CT)12 marquée
CTCTCTCTCTCTCTCTCTCTCTCTC
Anti- DIG Alk. DIG
Phosph
Substrat lumière
hybridation Plasmide
pUC 19 Insert
Extraction de plasmides des clones positifs, et séquençage des inserts
Région bordante Microsatellite Région bordante
Définition et synthèse d'amorces PCR spécifiques des régions bordant le microsatellite
Développement de microsatellites
Extraction d'ADN simplifiée
Plante 1 avec allèle court Plante 2 avec allèle long
Amplification PCR
Sites
d'amorçage spécifiques
Génotypage de microsatellites
Génotypage de microsatellites
Electrophorèse sur gel de polyacrylamide dénaturant (classique ou sur séquenceur)
Génotypage de microsatellites
- extraction d'ADN génomique total : pas forcément très pur quantité très faible (20 ng) - PCR avec des amorces spécifiques d'un point précis du génome (STS) - gel d'agarose haute résolution ou de polyacrylamide ou un séquenceur
monolocus codominant reproductible
hyperpolymorphisme VNTR
développement préalable très lourd génotypage très rapide
extractions d'ADN très rapides
Marqueurs microsatellites (SSR)
La technique d’AFLP
… mais d’abord, les deux autres techniques sur laquelle elle est fondée
Amplified Fragment Length Polymorphism
Eco RI 5'… G AATT C …3' 3'… C TTAA G …5'
Eco RV 5'… GAT ATC …3'
3'… CTA TAG …5' Sau 3A I 5'… GATC …3'
3'… CTAG …5'
Pst I 5'… C TGCA G …3' 3'… G ACGT C …5’
Rappel : la « restriction » enzymatique
*
*
Les enzymes de restriction sont des « ciseaux chimiques » extrêmement spécifiques
La technique de CAPS
Cleaved Amplified Polymorphic Sequences
Restriction enzymatique sur produits d'amplification PCR
Trois enzymes de restriction :
quatre
haplotypes dans la population
La technique de RAPD
Randomly Amplified Polymorphic DNA
multilocus dominant
peu reproductible (ne considérer que les bandes intenses) polymorphisme modéré par locus
pas de développement préalable très rapide
extractions d'ADN assez rapides La technique de RAPD
Randomly Amplified Polymorphic DNA
Principe de la technique AFLP
Exemples de AFLP
Electrophorèse capillaire
Electrophorèse en gel
multilocus dominant reproductible
polymorphisme modéré par locus peu de développement préalable rapide
extractions d'ADN assez rapides Marqueurs AFLP
Techniques ne nécessitant pas d'information de séquence AFLP Amplified Fragment Length Polymorphism RAPD Randomly Amplified Polymorphic DNA
Techniques appliquées à des produits d’amplification PCR (STS : sequence-tagged site)
SSR Simple Sequence Repeats, Microsatellites CAPS Cleaved Amplified Polymorphic Sequence Techniques pour SNP Single Nucleotide Polymorphism (diverses)
Les techniques usuelles de marquage
Point de vue BM Point de vue génétique
Marqueurs : - multilocus - dominants
Marqueurs :
- locus-spécifiques - co-dominants
Quels marqueurs pour quoi faire ?
Empreintes génétiques (marqueurs multilocus dominants)
– Etudes de diversité : structuration inter- ou intra-populations, distances génétiques, classifications, contrôle d'hybridations
– Clonage positionnel
– Saturation rapide de cartes génétiques
Marqueurs co-dominants locus-spécifiques
– Construction de cartes consensus (marqueurs, gènes) d'une espèce – Cartographie comparée (entre espèces : notion de conservation de synténie)
– Cartographie de QTL (Quantitative Trait Loci)
Police scientifique : SSR en multiplex
Cartographie génétique
Cartographie génétique
Carte génétique : agencement linéaire de locus le long d’un génome, dont les positions relatives ont été déterminées à partir des taux de recombinaison.
L’unité de distance est le centimorgan, et non pas le taux de recombinaison.
Ne pas confondre carte génétique et carte physique, dont l’unité de distance est le kilobase
Pourquoi cartographier ?
– Etude de l'organisation des génomes
– Cartographie comparée (étude de synténie)
– Cartographie de QTL (Quantitative Trait Loci) dans des croisements contrôlés, ou en populations (« génétique d’association »)
– Isolement de gènes (positional cloning) – SAM (Sélection assistée par marqueurs)
Descendances issues d’un croisement entre parents fixés
G1 D1
G1 D1
G2 D2
G2 D2
x
G1 D1
G2 D2
F1
A partir de la F1, on peut dériver trois types de descendances : - types « haploïdes »
- F2 (ou F3)
- lignées recombinantes (ou « hautement » recombinantes)
Le taux de recombinaison
G1 D1
G2 D2
G1 D1 G2 D2 G2 D1 G1 D2
Parentaux : N – n Recombinés : n
Taux de recombinaison : r = n / N Méiose
Gamètes ou spores
(1 – r) / 2 (1 – r) / 2 r / 2 r / 2
0 ≤ r ≤ 0,5
Si r n’est pas significativement différent de 0,5, il y a indépendance génétique Si r est significativement inférieur à 0,5, il y a liaison génétique.
Pourquoi le taux de recombinaison ne doit pas être pris comme mesure de distance génétique
Une « bonne » distance doit satisfaire :
d
AC= d
AB+ d
BCA B C
r
AC≠ r
AB+ r
BCOr :
B A
b A
B A
b A
B A
B
A = Pas de recombinaison (0 CO ou nb pair de CO) b
A = Recombinaison (nb impair de CO)
Le problème des crossing-over multiples…
CO
Deux CO produits lors d’une même méiose ne sont jamais très proches les uns des autres
Avec interférence
Sans interférence (placement au hasard)
… et de l’interférence
De r à D :
les fonctions de
distance
Recombinaison et distance génétique
– Distance => additivité
– r n'est pas additif !
– Correction des doubles recombinants => Haldane (en cM)
– Prise en compte de l’interférence => Kosambi (en cM)
Centimorgan (cM) : distance entre deux locus telle que l’espérance du nombre de crossing-over lors d’une méiose est 0,01.
DH = – 50 ln (1 – 2r)
0,32 1 Morgan (100 cM) ó 1 CO en
moyenne par méiose et par gamète
Descendances « haploïdes »
– Haploïdes doublés
– Mégagamétophytes (gymnospermes)
– Backcross
Parents F1
Haploïdes doublés
Méiose
Les lignées haploïdes doublés
Le stock chromosomique des produits de la méiose est doublé
« Génotypes graphiques »
La méiose est un processus qui fractionne peu le génome.
La mécanique de la méiose impose qu’il y ait au moins un crossing-over.
Locus A Locus B
H3
Vania F1
Haploïdes doublés de Capsicum annuum
Estimation du taux de recombinaison en backcross
G1 D1
G2 D2
G1 D1
G1 D1
G1 D1
G2 D2
Parents
F1
G1 D1
G1 D1
G1 D1
G1 D1
G1 D1
G2 D2
G1 D1
G2 D1
G1 D1
G1 D2
r = n / N Backcross
Mégagamétophytes
Méiose
Mégaspores => mégagamétophytes
Parents F1
Locus A Locus B
Populations F2
Parents
F1
F2
Autofécondations ou croisements frère-soeur
Estimation de r dans une F2
(1–r)/2 (1–r)/2 r/2 r/2
G1D1 G2D2 G1D2 G2D1
(1–r)/2 G1D1 G1D1 G2D2 G1D2 G2D1
G1D1 G1D1 G1D1 G1D1
(1–r)/2 G2D2 G1D1 G2D2 G1D2 G2D1
G2D2 G2D2 G2D2 G2D2
r/2 G1D2 G1D1 G2D2 G1D2 G2D1
G1D2 G1D2 G1D2 G1D2
r/2 G2D1 G1D1 G2D2 G1D2 G2D1
G2D1 G2D1 G2D1 G2D1
(1–r)/2 (1–r)/2 r/2 r/2
G1D1 G2D2 G1D2 G2D1
(1–r)/2 G1D1 G1D1 G2D2 G1D2 G2D1
G1D1 G1D1 G1D1 G1D1
(1–r)/2 G2D2 G1D1 G2D2 G1D2 G2D1
G2D2 G2D2 G2D2 G2D2
r/2 G1D2 G1D1 G2D2 G1D2 G2D1
G1D2 G1D2 G1D2 G1D2
r/2 G2D1 G1D1 G2D2 G1D2 G2D1
G2D1 G2D1 G2D1 G2D1
Estimation de r dans une F2
(1–r)/2 (1–r)/2 r/2 r/2
G1D1 G2D2 G1D2 G2D1
(1–r)/2 G1D1 G1D1 G2D2 G1D2 G2D1
G1D1 G1D1 G1D1 G1D1
(1–r)/2 G2D2 G1D1 G2D2 G1D2 G2D1
G2D2 G2D2 G2D2 G2D2
r/2 G1D2 G1D1 G2D2 G1D2 G2D1
G1D2 G1D2 G1D2 G1D2
r/2 G2D1 G1D1 G2D2 G1D2 G2D1
G2D1 G2D1 G2D1 G2D1
Estimation de r dans une F2
(1–r)/2 (1–r)/2 r/2 r/2
G1D1 G2D2 G1D2 G2D1
(1–r)/2 G1D1 G1D1 G2D2 G1D2 G2D1
G1D1 G1D1 G1D1 G1D1
(1–r)/2 G2D2 G1D1 G2D2 G1D2 G2D1
G2D2 G2D2 G2D2 G2D2
r/2 G1D2 G1D1 G2D2 G1D2 G2D1
G1D2 G1D2 G1D2 G1D2
r/2 G2D1 G1D1 G2D2 G1D2 G2D1
G2D1 G2D1 G2D1 G2D1
Estimation de r dans une F2
(1–r)/2 (1–r)/2 r/2 r/2
G1D1 G2D2 G1D2 G2D1
(1–r)/2 G1D1 G1D1 G2D2 G1D2 G2D1
G1D1 G1D1 G1D1 G1D1
(1–r)/2 G2D2 G1D1 G2D2 G1D2 G2D1
G2D2 G2D2 G2D2 G2D2
r/2 G1D2 G1D1 G2D2 G1D2 G2D1
G1D2 G1D2 G1D2 G1D2
r/2 G2D1 G1D1 G2D2 G1D2 G2D1
G2D1 G2D1 G2D1 G2D1
Estimation de r dans une F2
(1–r)/2 (1–r)/2 r/2 r/2
G1D1 G2D2 G1D2 G2D1
(1–r)/2 G1D1 G1D1 G2D2 G1D2 G2D1
G1D1 G1D1 G1D1 G1D1
(1–r)/2 G2D2 G1D1 G2D2 G1D2 G2D1
G2D2 G2D2 G2D2 G2D2
r/2 G1D2 G1D1 G2D2 G1D2 G2D1
G1D2 G1D2 G1D2 G1D2
r/2 G2D1 G1D1 G2D2 G1D2 G2D1
G2D1 G2D1 G2D1 G2D1
Estimation de r dans une F2
(1–r)/2 (1–r)/2 r/2 r/2
G1D1 G2D2 G1D2 G2D1
(1–r)/2 G1D1 G1D1 G2D2 G1D2 G2D1
G1D1 G1D1 G1D1 G1D1
(1–r)/2 G2D2 G1D1 G2D2 G1D2 G2D1
G2D2 G2D2 G2D2 G2D2
r/2 G1D2 G1D1 G2D2 G1D2 G2D1
G1D2 G1D2 G1D2 G1D2
r/2 G2D1 G1D1 G2D2 G1D2 G2D1
G2D1 G2D1 G2D1 G2D1
Estimation de r dans une F2
(1–r)/2 (1–r)/2 r/2 r/2
G1D1 G2D2 G1D2 G2D1
(1–r)/2 G1D1 G1D1 G2D2 G1D2 G2D1
G1D1 G1D1 G1D1 G1D1
(1–r)/2 G2D2 G1D1 G2D2 G1D2 G2D1
G2D2 G2D2 G2D2 G2D2
r/2 G1D2 G1D1 G2D2 G1D2 G2D1
G1D2 G1D2 G1D2 G1D2
r/2 G2D1 G1D1 G2D2 G1D2 G2D1
G2D1 G2D1 G2D1 G2D1
Estimation de r dans une F2
(1–r)/2 (1–r)/2 r/2 r/2
G1D1 G2D2 G1D2 G2D1
(1–r)/2 G1D1 G1D1 G2D2 G1D2 G2D1
G1D1 G1D1 G1D1 G1D1
(1–r)/2 G2D2 G1D1 G2D2 G1D2 G2D1
G2D2 G2D2 G2D2 G2D2
r/2 G1D2 G1D1 G2D2 G1D2 G2D1
G1D2 G1D2 G1D2 G1D2
r/2 G2D1 G1D1 G2D2 G1D2 G2D1
G2D1 G2D1 G2D1 G2D1
Estimation de r dans une F2
(1–r)/2 (1–r)/2 r/2 r/2
G1D1 G2D2 G1D2 G2D1
(1–r)/2 G1D1 G1D1 G2D2 G1D2 G2D1
G1D1 G1D1 G1D1 G1D1
(1–r)/2 G2D2 G1D1 G2D2 G1D2 G2D1
G2D2 G2D2 G2D2 G2D2
r/2 G1D2 G1D1 G2D2 G1D2 G2D1
G1D2 G1D2 G1D2 G1D2
r/2 G2D1 G1D1 G2D2 G1D2 G2D1
G2D1 G2D1 G2D1 G2D1
Estimation de r dans une F2
Fréquences théoriques et observées dans une F2
n1/N n2/N n3/N n4/N n5/N n6/N
n7/N
n8/N n9/N
Un calcul de maximum de vraisemblance permet d’estimer la valeur la
plus probable de r.
Comment estimer r ?
Le maximum de vraisemblance
Application au problème de l'estimation de r dans une descendance F2
P ( X = k ) = n!
k ! ( n − k ) ! p
k
( 1 − p )
n−kPour une variable X qui suit une loi binomiale, on a :
P( X
1= n
1, X
2= n
2, ... , X
9= n
9) = N !
n
1!n
2! ... n
9! p
1n1p
2n2... p
9n9Généralisation : loi multinomiale (ici appliquée au cas d'une F2)
où pi = f(r)
Solution
Parents F1
F2
Autofécondation
> 6 générations SSD
Les lignées recombinantes
LR
Locus A RIL
Locus B
Lai et al. 2010. Nature Genetics, 42, 1027
La méiose est un processus qui (en général) fractionne peu le génome : la preuve par le séquençage (chez le maïs)
PI 414723 F1 Védrantais Lignées recombinantes de Melon
G1 D1 G1 D1
G2 D2 G2 D2
G2 D1 G2 D1
G1 D2 G1 D2
N – n n
Taux de recombinaison apparent :
R
0,5
0,0 0,1 0,2 0,3 0,4
0,0 0,1 0,2 0,3 0,4 0,5
r
Estimation de r dans des lignées recombinantes
r r N
R n
2 1
2
= +
=
(
R)
r R
= −
1 2
Taux de recombinaison :
F2
> 6 génér. AF
Les lignées hautement recombinantes
« Intermated Recombinant Inbred Lines »
LHR IRIL
n
générations d’intercroisements panmictiques« Pseudo F2 »
Locus A Locus B
Plusieurs générations d’intercroisements aléatoires (panmixie)
Plus de crossing-over au total Plus de recombinaisons Distances génétiques allongées
Cartes plus précises pour un même effectif
Les lignées hautement recombinantes
« Intermated Recombinant Inbred Lines »
Estimation de
r
avec des lignées hautement recombinantes Winkler et al., 2003, Genetics⎟⎠
⎜ ⎞
⎝
⎛ −
+
− −
= n
n r
r
R r (1 )
2 1
2 1 1
2
1 n : nombre de générations
de panmixie
Rn
0,0 0,1 0,2 r 0,3 0,4 0,5
0,0 0,1 0,2 0,3 0,4 0,5
R0 R2
R4 R6
A B
R0 Rn
929.7 cM 198 cM
F2 IRIL
Allongement de la carte génétique du maïs (chromosome 1) dans des
lignées hautement recombinantes (IRIL)
(n = 4)
F2
RIL IRIL
Multiparent Advanced
Generation InterCross (MAGIC) BC
NIL
Bergelson & Roux, 2010, Nature Review Genetics
Bilan des
descendances couramment utilisées en génétique
Bergelson & Roux, 2010, Nature Review Genetics
HIF: Heterogeneous Inbred Family RIL: Recombinant Inbred Lines IRIL: Intermated Recombinant Inbred Lines
BC: Back-Cross
NIL: Near Isogenic Lines
Estimation de r : bilan
§ Descendances de type haploïde : directe (r = n/N)
§ Descendances F2 (ou F3) : maximum de vraisemblance
§ Lignées recombinantes :
Dans chaque cas r doit être transformé via une fonction de distance => D (cM)
(
R)
r R
= −
1 2
Processus de cartographie génétique
– Tests deux-points (Chi2 ou LOD) => groupes de liaisons
– Tests trois-points (LOD) => ordre au sein des groupes – Calculs des distances => carte génétique
– Utilisation d'un « squelette » => assignation à des "bins"
§ Il y a « saturation » lorsque, sur un groupe de liaisons, tous les marqueurs sont génétiquement liés de proche en proche, c’est-à-dire que r < 0,5 pour tous les marqueurs adjacents (et non pas D < 50 cM !).
§ Il y a autant de groupes de liaison que de chromosomes.
umc107a umc161a
4
(403 cM)
nc135
0
php20725a
43
umc31a
32
npi386
39
bnlg490
13 6 phi026 umc1511
13
umc14a
13
bnlg1621
11
bnlg1189
55
umc66a
22
bnlg1444
50
umc158
6
csu39
30
php20608a
36
umc1050
36 5
(387 cM)
nc130
0
bnlg1006
9
npi409
12
bcd808d
58
umc1894
10
bnlg1879
24
rz474a
13
umc1705
21
bnl4_36
21
bnlg1892
8
bnlg1208
bnl5_71a
19
ph333597
11
umc126a
30
umc108
24
bnlg1836
27
bnlg118
40
umc1225
27
bnlg389
28
6
(333 cM)
bnlg1043
0
bnlg161
umc85a
24
umc1006
17
umc1595
10
umc65a
11
nc009
20
umc21
27
bnlg2249
20
umc1020
15
nc013
22
umc38a
29
umc132a
36
phi070
6
umc1897
51 7 bnlg1740 bnlg1136
21
umc1653
5
umc1127
8
12 1
2
(386 cM)
0
18
17
21
14
umc1756
14 10
umc44b
15 8
27
25
bnlg166
11
9 phi092
6 7
16
bnlg2077
10
asg20
bnlg1721
12 10 8
phi090
14 10
12
umc1256
10
38
lim104
32
2
1
(596 cM) Phi097
0
umc1977
42
umc157
31
bnlg1007
59
umc76
24
bnlg147
24
bnlg1203
22
php20725b
asg45
17
bnlg1811
15
csu3
19
umc67
37
umc1709
48
asg62
14
umc1833
53
umc128
30
umc1924
13
csu164a
19
21
20
bnlg1055
20
phi064
51
bnl6_32
13
1 2 3 4 5 6 7 9 8 10 11
bnl8_45a
phi96100 bnlg1017 mmc0111 bnlg1302
umc6a
bnlg1537 bnlg1393
umc34
bnlg1018
umc131 umc255a
bnlg1329 mmc0143 dupssr24 dupssr30 bnlg1746
umc49a
bnlg1893
1 2 3 4 5 6 7 8 9
10
4 5
1 2 3 45
7 8
9 6
10 11
6
1 2 3 4 5 6 7 8
2 1 3
4 5 6 7
8
0 0 0
3
(529 cM)
umc1746
bnl8_15
umc1970
csu32
bnlg1523
asg24
bnlg1904
asg48
umc1012 umc1392
bnlg2047 dupssr05 mmc0312 umc1527
umc102
umc1501
bnl5_37a
bnlg1350 bnlg1951 bnlg1931 bnlg1160
bnl6_16a
umc1135 umc1399 umc1489 mmc0071
umc16a
umc1140 bnlg1108 umc1273
umc63a
bnlg1257 bnlg1182 bnlg1536 bnlg1754 bnlg1496
csu25a
38
umc1062
6
umc1641
6
3
0
15
26
29
25
16
15 5
18 10
10 7
20
33
34
29
20 9 13 14
18 7 8
27 6 10 6
14
14 6
1 2 3 4 5
7 8 9 10 6
0
7
(385 cM)
umc1545
0
bnlg1367
20
bnlg2132
50
asg8
10
mmc0171 php20581a
10
phi112
20
umc1016
21
phi034
8
bnl15_21
42
bnlg434
13
dupssr09
8
bnlg2271
18
umc254
14
bnlg1666
30
bnlg2259
41
umc1295
6
umc245
42
phi116
30
7
1 0
2 3
4
5
6 (389 cM) 8
npi220a
0
umc1592
15
umc1327
23
bnl9_11a
19
umc1034
31
umc124
10
bnlg1834
17
bnlg1863
15
bnl7_08a
25
bnl2_369
17
umc1316
23
bnlg1152
31
bnlg1065
43
bnlg1823
25
umc1268
6
npi414
8
agrr21
29
bnlg1131
53
9
(322 cM) umc109
0
bnlg1810
30
umc192
11
dupssr06
9
bnlg244
26 umc1033
phi061
6
phi065
15
csu147
11 bnlg1714 phi032
19
umc95
14
rz574b
15
umc1366
43
umc1789
25 6 umc1804 bnlg619
12
bnlg128
15
csu54b
59
8 9
1 2 3
4
9 6 7 8 5
1 2 3
4
6 7
8 5
10
(261 cM) php20075
0
npi285
28
phi059
22
umc130
10
bnlg1712
16 umc64a
bnlg1526
7
umc259
17
umc44a
37
bnlg2190
27
bnl7_49a
18
bnlg1360
20
bnlg1450
24
bnlg1185
34
10
1 2 3
4 6 7 5
9
Carte génétique du maïs
(cM. Distance de Haldane)
Commentaires sur les cartes génétiques
– Relations carte physique – carte génétique – Notion de synténie (synteny)
– La cartographie fine
Relations carte physiques – carte génétiques
Physical and genetic maps of chromosome 4
of A. thaliana (Schmidt et al. 1995, Science, 270, 480)
Comparaison carte physique – carte génétique
Les banques de grands fragments d’ADN
(BAC, YAC) ont
permis de construire des cartes physiques
B73 sequence
IBM genetic map
Dist. génétiques (cM) Dist. physiques (Mbp)
Ganal et al., 2011
Comparaison carte génétique / carte physique chez le maïs : la carte génétique peut révéler des erreurs d’assemblage du génome
centromère Chrom 3
Position physique sur la séquence de la lignée B73 (Mbp) Position génétique (centiMorgan) Taux de recombinaison (cM/Mb)
Ganal et al., 2011
IBM LHRF
Comparaison carte physique – carte génétique (lignée de maïs B73)
Ganal et al. 2011.
PLoS ONE.
Les deux couleurs correspondent à deux
croisements différents
Différences entre sexes
Mercier et al., 2015
Nombre moyen de CO par chromosome et par méiose chez divers eucaryotes
Champignons Animaux
Plantes Autres
Un point représente un c h r o m o s o m e d ’ u n e espèce.
Alors que la taille physique des chromosomes varie de plus d'un facteur 1000, le nombre de CO par chromosome reste la plupart du temps entre 1 et 3 ou 4. Il existe donc une forte régulation pour limiter le nombre de CO.
Notion de synténie (« même fil »)
On parle de synténie lorsque les gènes ou marqueurs sont portés par le même chromosome, qu’ils soient génétiquement liés ou pas. Il peut alors y avoir colinéarité ou pas.
Devos & Gale (2000) Plant Cell, 12, 637.
Duplications dans le génome du riz Synténie riz-orge
Evidence and evolutionary analysis of ancient whole-genome duplication in barley predating the divergence from rice
Thiel et al. 2009. BMC Evolutionary Biology, 9:209
La cartographie fine
Principe
Utiliser la recombinaison
Matériels génétiques
– Lignées quasi-isogéniques (Near-isogenic lines – NIL), et lignées d’introgression (IL)
– Lignées “hautement” recombinantes (LHR)
(Intermated recombinant inbred lines – IRIL)
x
x
x Backcross
(BC)
Parent F1 récurrent
BC1 : 1/2
BC2 : 1/4
BC3 : 1/8 etc.
x
BC2
Parent récurrent Parent
donneur
Région à « introgresser »
x x x x
x
Crossing-over
Construction de lignées quasi-isogéniques NIL : Near Isogenic Lines
BC4
M
⊗ ⇒
¼ ¼ ½
NIL
+ rares recombinants Construction de lignées quasi-isogéniques
NIL : Near Isogenic Lines
_ + +
R D R’ (NIL)
R D R’ R D R’ R D R’
Recherche de marqueurs dans une région donnée
Le marqueur est dans la région introgressée