Cartographie g ´en ´etique par analyse de liaison
INRA, Brigitte Mangin
Septembre 2016
1 Introduction
2 Mod ´elisation
Les ph ´enotypes continus
3 Un QTL
Le test du rapport de vraisemblance Quel seuil pour la d ´etection d’un QTL ?
4 Pour aller plus loin D’autres mod ´elisations Pedigrees complexes Les logiciels
Introduction
Qu’est ce que l’analyse de liaison ?
=⇒ C’est l’ ´etude de latransmissionall ´elique parmi des individusapparent ´es
Que recherche-t’on ?
=⇒ Desg `enescausaux responsables d’une maladie, caract `ere binaire
ou
=⇒ DesQTLs, c’est- `a-dire des loci du g ´enome qui expliquent la variabilit ´e d’un caract `ere quantitatif.
Que cherche t-on `a faire ?
=⇒ lier le caract `ere binaire ou quantitatif (ph ´enotype) `a un endroit du g ´enome (g ´enotype au g `ene ou au QTL)
Comment s’y prend-t’on ?
=⇒ suit la transmission all ´elique `a l’aide de marqueurs mol ´eculaires
Mod ´elisation
La mod ´elisation pour quoi faire ?
=⇒ “d ´ecrire” la relation entre le ph ´enotype et le g ´enotype En terme de probabilit ´e “p ´en ´etrance”, ph ´enotype binaire
fdd= Prob( malade|dd) fDd = Prob( malade|Dd) fDD = Prob( malade|DD)
En terme de densit ´e de probabilit ´eL, ph ´enotype continuY fqq=L(Y|qq)
fQq=L(Y|Qq) fQQ =L(Y|QQ)
Mod `ele QTL simple dans un pedigree simple
Nous allons nous restreindre
`a une mod ´elisation simple qui postule la pr ´esence d’un unique QTL
`a une descendance simple, le back-cross dans le cadre de la g ´en ´etique mend ´elienne
back-cross : 1/2qq, 1/2Qqou 1/2qQ, 1/2QQ
Les ph ´enotypes continus
Back-cross ou r ´etrocroisement
La distribution du ph ´enotype (courbe noire)
est un m ´elange 1/2:1/2 entre les distributions du ph ´enotype pour chaque g ´enotype
les distributions du ph ´enotype pour chaque g ´enotype ont la m ˆeme variance, mais pas la m ˆeme moyenne et sont Gaussiennes
Donn ´ees
nobservations quantitatives Mmarqueurs
Yn Mmn
n=1, ...,N m=1, ...,M
Param `etres du mod `ele
σ2 variance r ´esiduelle µqQ effet moyen du g ´enotype
qQau QTL
µQQ effet moyen du g ´enotype QQau QTL
Mod `ele de m ´elange Yn=
µqQ+n sina le g ´enotypeqQau QTL µQQ+n sina le g ´enotypeQQau QTL
Les ph ´enotypes continus
Les param `etres g ´en ´etiques
Back-cross
fond g ´en ´etique µ= µQQ+µ2 Qq effet de substitution all ´elique α=µQQ−µQq
ou α=µqq−µQq
et les marqueurs `a quoi y servent ?
`aconnaˆıtrele g ´enotype au QTL
lorsque le QTL et le marqueur sont au m ˆeme locus
`ainf ´ererle g ´enotype au QTL,“pseudo-marqueur”
en calculant la probabilit ´e que l’individunsoit de g ´enotype qQouQQsachant ses marqueurs et la carte g ´en ´etique ou `aimputerle g ´enotype au QTL,“pseudo-marquage”
en tirant al ´eatoirement le g ´enotype au QTL avec les probabilit ´es que l’individunsoit de g ´enotypeqQouQQ sachant ses marqueurs et la carte g ´en ´etique
Comment d ´etecter un QTL ?
D ´etecter un QTL c’est :
prendre un risque et affirmer qu’il y a un QTL⇒c’est donc une proc ´edure de test
Quelle est l’hypoth `ese nulle ? Quelle est l’hypoth `ese alternative ? Quelle statistique de test ?
le localiser sur le g ´enome en r ´ep ´etant le test tout le long du g ´enome⇒c’est donc une proc ´edure de tests multiples
Quel est le seuil de rejet de l’hypoth `ese nulle ? estimer les param `etres du mod `ele
Tester l’effet du QTL
Hypoth `ese nulleH0={tous les g ´enotypes au QTL ont la m ˆeme moyenne}
Hypoth `ese alternativeH1={l’un au moins des g ´enotypes au QTL a une moyenne diff ´erente des autres}
Pour le Back-cross
H0={µQQ =µQq}versusH1 ={µQQ 6=µQq} ou
H0 ={α=0}versusH1 ={α6=0}
Le cas id ´eal : un marqueur sur le locus du QTL
Mod `ele lin ´eaire : comparaison de moyennes ou ANOVA
% g=1Y1k =µ+α2 +1k Yn
& g=2Y2k =µ−α2 +2k
Source de ddl SCE CM= SCE
ddl F
variation
QTL/marqueur 1 SCEM=P
gng(Yg.−Y..)2 CMM CMM CMR r ´esiduelle N−1 SCER=P
gk(Ygk−Yg.)2 CMR
Le cas non id ´eal
Se contenter de faire la comparaison de
moyennes entre leset lesc’est perdre de la puissance.
Les marqueurs
flanquants le locus QTL vont ˆetre utilis ´es pour inf ´erer le g ´enotype aux QTL
=⇒c’est la m ´ethode appel ´ee “l’interval mapping”
Le test du rapport de vraisemblance
“l’interval mapping”
au locusl
Le test du rapport du maximum de vraisemblance au locusl RV(l) = maximum de la vraisemblance siα=0
maximum de la vraisemblance si un QTL est enl Lander et Botstein, Genetics, 1989
La courbe duLOD
C’est la courbe obtenue en faisant vari ´elle long de la carte g ´en ´etique et en transformantRV(l)par la fonction−log10() LeLODtest
C’est le locus o `u cette courbe est maximum
Un exemple de courbe de LOD
distance en Morgan
LOD
0.0 0.2 0.4 0.6
246810
Resistance au fletrissement en F2 chez la tomate
chromosome 6
Quel seuil pour la d ´etection d’un QTL ?
Seuil de rejet du LOD test
Loi “asymptotique” sousH0={pas de QTL enl}
Au locusl, pour le back-cross, leLOD(l)/0.217suit une loi de χ2(1)
donc siLOD(l)>3.84×0.217on rejette l’absence de QTL enl au risque 5%
MAIS on fait un test `a chaque locusl ... la question difficile des tests multiples non ind ´ependants
Le seuil d ´epend
du risque global choisi
du nombre de groupes de liaison du nombre de marqueurs
et de leur localisation du type de descendance
=⇒formule analytique ( ´etude asymptotique)
Reba¨ı et al, Genetics,1994
=⇒simulation par Monte-Carlo sousH0 par permutation desYn
Churchill et Doerge, Genetics, 1994
Quel seuil pour la d ´etection d’un QTL ?
Seuil pour le LOD test par simulations
longueur du groupe de liaison : 1 M intervalle entre les marqueurs
type risque 20 cM 10 cM ≤1 cM
BC 5 % 1.5 1.6 1.8
BC 1 % 2.2 2.3 2.6
F2 5 % 2.2 2.3 2.6
F2 1 % 2.9 3.1 3.4
longueur du groupe de liaison : 2 M
BC 5 % 1.8 1.9 2.1
BC 1 % 2.5 2.6 3.0
F2 5 % 2.4 2.6 3.0
F2 1% 3.2 3.4 3.8
Principe des permutations
en permutant les ph ´enotypes,
on casse la
corr ´elation en- tre g ´enotype et ph ´enotype, on cr ´ee donc un
´echantillon sous l’hypoth `ese nulle
D’autres mod ´elisations
Plusieurs QTL
Effet du QTL al ´eatoire (animaux)
Effet polyg ´enique al ´eatoire (animaux) ou effet fond g ´en ´etique fixe (plantes)
Effet d’ ´epistasie (interaction) entre QTLs
Effet d’ ´epistasie (interaction) entre un QTL et le fond g ´en ´etique
QTL en pl ´eiotropie ....
Diall `ele de lign ´ees homozygotes
Pedigrees complexes
Familles de demi-fr `eres
Pedigree humain
Les logiciels
Pour les QTL
l’anc ˆetre : MAPMAKER/QTL le cl ´e en main : QTL carthographer le payant : mapQTL
le futur : R/qtl
“les sp ´ecialis ´es”
pour les pedigrees et mod `eles animaux : QTLMap pour plusieurs descendances : MCQTL