Cartographie des g `enes et des caract `eres
Maxime Bonhomme
Novembre 2019
Plan
1 Cartographie des g `enes Quoi, pourquoi
Comment ?
2 Cartographie g ´en ´etique des caract `eres quantitatifs Cartographie de Quantitative Trait Loci (QTL)
Cartographie par g ´en ´etique d’association
Quoi, pourquoi
Les cartes: s’orienter dans le g ´enome en positionnant les marqueurs
Types
Cartes physiques: distance r ´eelle (Kb, Mb), `a partir de fragments d’ADN. R ´esolution habituellement ´elev ´ee.
Cartes g ´en ´etiques: s’appuie sur la recombinaison durant la m ´eiose. Distance “statistique”.
Carte g ´en ´etique
Repr ´esentation d’un g ´enome positionnant un ensemble de rep `eres (marqueurs) dont on connaˆıt les positions sur des groupes de liaison (chromosomes id ´ealement).
Quoi, pourquoi
Exemple
Carte g ´en ´etique
Groupes de liaison g ´en ´etique
G ´enome
Chromosomes
Quoi, pourquoi
Pourquoi
Identifier les r ´egions du g ´enome influenc¸ant un caract `ere d’int ´er ˆet (maladie ou caract `ere quantitatif plus complexe) Positionner et identifier un g `ene (clonage positionnel) Comparer les g ´enomes ( ´etude de la synt ´enie, ´evolution, transfert d’information)
Faciliter la construction de cartes physiques, assemblage Etudier la m ´eiose´
Quoi, pourquoi
Les bases: lois de Mendel
Loi de s ´egr ´egation ind ´ependante
L’assortiment de plusieurs g `enes dans une cellule sexuelle se fait de fac¸on ind ´ependante entre les diff ´erents g `enes. TailleTtet forme Rr(rid ´e).
Tt R r TR Tr t R t r
1/4 1/4 1/4 1/4
Quoi, pourquoi
Le principe historique de la cartographie
Liaison g ´en ´etique(Bateson 1905) Pour certaines paires de g `enes, la fr ´equence des combinaisons parentales dans les gam `etes est sup ´erieure `a ce que l’on attend.
On parle deliaison g ´en ´etique.
Expliqu ´e par Morgan (1911) par l’appartenance `a un m ˆeme chromosome et un ´eventuel chiasma durant la m ´eiose (crossing-over).
Quoi, pourquoi
Un mod `ele de la m ´eiose
50% de recombinants au plus.
Comment ?
Information g ´en ´etique
Loci, g `enes, marqueurs:A,B. Emplacement sur un chromosome
Polymorphisme: pr ´esente au moins deux formes diff ´erentes (all `elesAa).
G ´enotype: s ´equence des paires d’all `eles port ´es par les chromosomes homologues (Aa Bb par exemple).
Homozygote: paire d’all `eles identiques (AA ou aa), sinon h ´et ´erozygote (Aa).
Haplotype: s ´equence des all `eles port ´es par chacun des chromosomes (AbaB par exemple).
Phase: information des deux haplotypes `a partir du g ´enotype `aAetB.
Comment ?
Cartographie g ´en ´etique
Comment ?
1 Accumulation d’observations du g ´enotype sur un
ensemble de marqueurs et sur un bon nombre de m ´eioses (beaucoup d’individus et/ou de g ´en ´erations d’individus)
Parents bien caract ´eris ´es (phase haplotypique).
Observation sur la descendance.
2 Estimer les taux de recombinaison entre marqueurs.
3 Calculer les distances g ´en ´etiques entre marqueurs `a partir de ces taux.
4 Ordonner les marqueurs `a partir des distances.
Comment ?
Recombinants et Non recombinants
MarqueursA,B
une cellule diplo¨ıde portant les haplotypesAB/ab, on peut avoir les gam `etes porteuses des haplotypes AB,ab,Ab,aB
Les deux premiers sontparentauxounon recombinants. Les deux autresrecombinants(nombre impair de cross-overs).
Comment ?
Estimer le taux de recombinaison
Taux de recombinaison≤ 12
Le taux de recombinaisonρAB entre les deux marqueursAet Best la proportion derecombinants.
Example
Entre 3 g `enesY (yellow),W (white),M(miniature) de la drosophile, on observeρY,W =1.3%,ρW,M =32.6%et ρY,M=33.8%. On peut penser que les marqueurs sont dans l’ordreY − W − M
Du fait des doubles crossing-overs, pour un ordreY − W − M: ρY,M< ρY,W+ρW,M (non additif)
Comment ?
Estimer ρ entre 2 marqueurs: exemple avec le back-cross
Un individu peut avoir
deux marqueurs homozygotes (AA,BB) ou h ´et ´erozygotes (Aa,Bb) : non recombinant(NR).
un h ´et ´erozygote, un homozygote (Aa,BBouAA,Bb) :recombinant (R).
Taux de recombinaison
ρ= R
R+NR
Comment ?
Distance g ´en ´etique
D ´efinition
La distance g ´en ´etiquedAB entre deux marqueursAetBest le nombre moyen decrossing-oversentre les deux marqueurs par m ´eiose.
Propri ´et ´es Additif
1cM (centiMorgan) correspond `a un crossover sur un haplotype pour 100 m ´eioses.
Fonction de Haldane - sans interf ´erence (1919) ρ= 1
2(1−e−2d) d=−1
2log(1−2ρ) Pour de faibles distances/taux de recombinaison,d≈ρ.
Comment ?
Construction de la carte
Cartographier
Pour chaque groupe de liaison (partie de chromosome), d ´eterminer l’ordre des marqueurs et les distances (taux de recombinaisons) qui s ´eparent deux marqueurs adjacents
Carte satur ´ee
autant de groupes que de chromosomes, tous les marqueurs de la carte sont li ´es `a un groupe.
Cartographie de Quantitative Trait Loci (QTL)
Que cherche-t-on `a faire ?
=⇒ lier un caract `ere binaire ou quantitatif (ph ´enotype) `a un endroit du g ´enome (g ´enotype au g `ene ou au QTL)dans la descendance d’un croisement, o `u les individus ont le m ˆeme degr ´e d’apparentement.
Cartographie de Quantitative Trait Loci (QTL)
Comment s’y prend-t-on ? Nous allons nous restreindre
`a une descendance simple, leback-cross dans le cadre de la g ´en ´etique mend ´elienne
back-cross : 1/2qq, 1/2Qqou 1/2qQ, 1/2QQ les marqueurs servent `a connaitre le g ´enotype au QTL (par exemple: qqouQq)
Cartographie de Quantitative Trait Loci (QTL)
La distribution du ph ´enotype (courbe noire, Gaussienne) est un m ´elange 1/2:1/2 entre les distributions du ph ´enotype pour chaque g ´enotype
les distributions du ph ´enotype pour chaque g ´enotype ont la m ˆeme variance, mais pas la m ˆeme moyenne param `etre g ´en ´etique du back-cross
effet de substitution all ´elique α=µQQ−µQq
ou α=µqq−µQq
Cartographie de Quantitative Trait Loci (QTL)
Test statistique pour le back-cross ( `a faire pour chaque marqueur de la carte g ´en ´etique)
H0={µQQ =µQq}versusH1 ={µQQ 6=µQq} ou
H0 ={α=0}versusH1 ={α6=0} Le cas id ´eal : si le marqueur est sur le QTL
comparaison de moyennes ou ANOVA.
Mais si le marqueur est distant du QTL, les mar- queurs flanquants le locus QTL vont ˆetre utilis ´es pour inf ´erer le g ´enotype aux QTL:
m ´ethode “interval mapping”
(pas d ´etaill ´ee dans ce cours)
Cartographie par g ´en ´etique d’association
Que cherche-t-on `a faire ?
=⇒ lier un caract `ere binaire ou quantitatif (ph ´enotype) `a un endroit du g ´enome (g ´enotype au g `ene ou au QTL)dans une population naturelleo `u les individus ont des degr ´es
d’apparentement tr `es divers. Exploiter les ´ev ´enements de recombinaison historiques.
Cartographie par g ´en ´etique d’association
Genome-Wide Association Study (GWAS)
Mat ´eriel et donn ´ees n ´ecessaires
´echantillon d’individus dans l’aire de distribution: forte richesse all ´elique !
populations structur ´ees g ´en ´etiquement du fait de l’ ´echantillonnage large.
apparentement plus fort entre individus d’une m ˆeme zone g ´eographique.
Cartographie par g ´en ´etique d’association
Genome-Wide Association Study (GWAS)
Mat ´eriel et donn ´ees n ´ecessaires
ph ´enotyper chaque individu pour le caract `ere ´etudi ´e (le caract `ere doit ˆetre suffisamment h ´eritable)
connaˆıtre le g ´enotype de chaque individus `a des milliers (millions) de marqueurs Single Nucleotide Polymorphism (SNPs) identifi ´es par s ´equence `a haut-d ´ebit des diff ´erents individus.
Cartographie par g ´en ´etique d’association
Genome-Wide Association Study (GWAS)
Analyse statistique
principe: le m ˆeme que pour l’analyse QTL: comparaison de moyennes aux diff ´erents g ´enotypes `a un SNP.MAISon doit tenir compte du biais d’association d ˆu `a la structure et
`a l’apparentement.
mod `ele lin ´eaire incluant l’effet de g ´enotype au SNP et l’effet de la population d’origine (pop1, pop2, ...).
mod `ele lin ´eaire mixte incluant en plus une matrice d’apparentement qui permet de donner une valeur g ´en ´etique variable d’un individu `a l’autre.
Cartographie par g ´en ´etique d’association
Genome-Wide Association Study (GWAS)
Analyse statistique
on effectue le test pour chaque SNP, et on r ´ecup `ere la p-valeur.
on d ´efini un seuil de significativit ´e de la p-valeur pour rejeter H0 (en tenant compte des tests multiples, par exemple10−6 `a10−8), pour dire qu’il y a (ou pas) une association significative entre le ph ´enotype et le marqueur SNP.
on peut visualiser les r ´esultats des tests `a l’ ´echelle du g ´enome avec unManhattan plot.
Cartographie par g ´en ´etique d’association
Genome-Wide Association Study (GWAS)
Manhattan plot
Consiste `a repr ´esenter l’intensit ´e d’association `a chaque SNP le long du g ´enome en utilisant−log10(p−value).
Exemple: GWAS de la r ´esistance quantitative de Medicago truncatula au parasite racinaire Aphanomyces euteiches.