• Aucun résultat trouvé

Mod ´elisation

N/A
N/A
Protected

Academic year: 2022

Partager "Mod ´elisation"

Copied!
26
0
0

Texte intégral

(1)

Cartographie g ´en ´etique par analyse de liaison

INRA, Brigitte Mangin

Septembre 2016

(2)

1 Introduction

2 Mod ´elisation

Les ph ´enotypes continus

3 Un QTL

Le test du rapport de vraisemblance Quel seuil pour la d ´etection d’un QTL ?

4 Pour aller plus loin D’autres mod ´elisations Pedigrees complexes Les logiciels

(3)

Introduction

Qu’est ce que l’analyse de liaison ?

=⇒ C’est l’ ´etude de latransmissionall ´elique parmi des individusapparent ´es

Que recherche-t’on ?

=⇒ Desg `enescausaux responsables d’une maladie, caract `ere binaire

ou

=⇒ DesQTLs, c’est- `a-dire des loci du g ´enome qui expliquent la variabilit ´e d’un caract `ere quantitatif.

(4)

Que cherche t-on `a faire ?

=⇒ lier le caract `ere binaire ou quantitatif (ph ´enotype) `a un endroit du g ´enome (g ´enotype au g `ene ou au QTL)

(5)

Comment s’y prend-t’on ?

=⇒ suit la transmission all ´elique `a l’aide de marqueurs mol ´eculaires

(6)

Mod ´elisation

La mod ´elisation pour quoi faire ?

=⇒ “d ´ecrire” la relation entre le ph ´enotype et le g ´enotype En terme de probabilit ´e “p ´en ´etrance”, ph ´enotype binaire

fdd= Prob( malade|dd) fDd = Prob( malade|Dd) fDD = Prob( malade|DD)

En terme de densit ´e de probabilit ´eL, ph ´enotype continuY fqq=L(Y|qq)

fQq=L(Y|Qq) fQQ =L(Y|QQ)

(7)

Mod `ele QTL simple dans un pedigree simple

Nous allons nous restreindre

`a une mod ´elisation simple qui postule la pr ´esence d’un unique QTL

`a une descendance simple, le back-cross dans le cadre de la g ´en ´etique mend ´elienne

back-cross : 1/2qq, 1/2Qqou 1/2qQ, 1/2QQ

(8)

Les ph ´enotypes continus

Back-cross ou r ´etrocroisement

La distribution du ph ´enotype (courbe noire)

est un m ´elange 1/2:1/2 entre les distributions du ph ´enotype pour chaque g ´enotype

les distributions du ph ´enotype pour chaque g ´enotype ont la m ˆeme variance, mais pas la m ˆeme moyenne et sont Gaussiennes

(9)

Donn ´ees

nobservations quantitatives Mmarqueurs

Yn Mmn

n=1, ...,N m=1, ...,M

Param `etres du mod `ele

σ2 variance r ´esiduelle µqQ effet moyen du g ´enotype

qQau QTL

µQQ effet moyen du g ´enotype QQau QTL

Mod `ele de m ´elange Yn=

µqQ+n sina le g ´enotypeqQau QTL µQQ+n sina le g ´enotypeQQau QTL

(10)

Les ph ´enotypes continus

Les param `etres g ´en ´etiques

Back-cross

fond g ´en ´etique µ= µQQ2 Qq effet de substitution all ´elique α=µQQ−µQq

ou α=µqq−µQq

(11)

et les marqueurs `a quoi y servent ?

`aconnaˆıtrele g ´enotype au QTL

lorsque le QTL et le marqueur sont au m ˆeme locus

`ainf ´ererle g ´enotype au QTL,“pseudo-marqueur”

en calculant la probabilit ´e que l’individunsoit de g ´enotype qQouQQsachant ses marqueurs et la carte g ´en ´etique ou `aimputerle g ´enotype au QTL,“pseudo-marquage”

en tirant al ´eatoirement le g ´enotype au QTL avec les probabilit ´es que l’individunsoit de g ´enotypeqQouQQ sachant ses marqueurs et la carte g ´en ´etique

(12)

Comment d ´etecter un QTL ?

D ´etecter un QTL c’est :

prendre un risque et affirmer qu’il y a un QTL⇒c’est donc une proc ´edure de test

Quelle est l’hypoth `ese nulle ? Quelle est l’hypoth `ese alternative ? Quelle statistique de test ?

le localiser sur le g ´enome en r ´ep ´etant le test tout le long du g ´enome⇒c’est donc une proc ´edure de tests multiples

Quel est le seuil de rejet de l’hypoth `ese nulle ? estimer les param `etres du mod `ele

(13)

Tester l’effet du QTL

Hypoth `ese nulleH0={tous les g ´enotypes au QTL ont la m ˆeme moyenne}

Hypoth `ese alternativeH1={l’un au moins des g ´enotypes au QTL a une moyenne diff ´erente des autres}

Pour le Back-cross

H0={µQQQq}versusH1 ={µQQ 6=µQq} ou

H0 ={α=0}versusH1 ={α6=0}

(14)

Le cas id ´eal : un marqueur sur le locus du QTL

Mod `ele lin ´eaire : comparaison de moyennes ou ANOVA

% g=1Y1k =µ+α2 +1k Yn

& g=2Y2k =µ−α2 +2k

Source de ddl SCE CM= SCE

ddl F

variation

QTL/marqueur 1 SCEM=P

gng(Yg.Y..)2 CMM CMM CMR r ´esiduelle N1 SCER=P

gk(YgkYg.)2 CMR

(15)

Le cas non id ´eal

Se contenter de faire la comparaison de

moyennes entre leset lesc’est perdre de la puissance.

Les marqueurs

flanquants le locus QTL vont ˆetre utilis ´es pour inf ´erer le g ´enotype aux QTL

=⇒c’est la m ´ethode appel ´ee “l’interval mapping”

(16)

Le test du rapport de vraisemblance

“l’interval mapping”

au locusl

Le test du rapport du maximum de vraisemblance au locusl RV(l) = maximum de la vraisemblance siα=0

maximum de la vraisemblance si un QTL est enl Lander et Botstein, Genetics, 1989

La courbe duLOD

C’est la courbe obtenue en faisant vari ´elle long de la carte g ´en ´etique et en transformantRV(l)par la fonction−log10() LeLODtest

C’est le locus o `u cette courbe est maximum

(17)

Un exemple de courbe de LOD

distance en Morgan

LOD

0.0 0.2 0.4 0.6

246810

Resistance au fletrissement en F2 chez la tomate

chromosome 6

(18)

Quel seuil pour la d ´etection d’un QTL ?

Seuil de rejet du LOD test

Loi “asymptotique” sousH0={pas de QTL enl}

Au locusl, pour le back-cross, leLOD(l)/0.217suit une loi de χ2(1)

donc siLOD(l)>3.84×0.217on rejette l’absence de QTL enl au risque 5%

MAIS on fait un test `a chaque locusl ... la question difficile des tests multiples non ind ´ependants

Le seuil d ´epend

du risque global choisi

du nombre de groupes de liaison du nombre de marqueurs

et de leur localisation du type de descendance

(19)

=⇒formule analytique ( ´etude asymptotique)

Reba¨ı et al, Genetics,1994

=⇒simulation par Monte-Carlo sousH0 par permutation desYn

Churchill et Doerge, Genetics, 1994

(20)

Quel seuil pour la d ´etection d’un QTL ?

Seuil pour le LOD test par simulations

longueur du groupe de liaison : 1 M intervalle entre les marqueurs

type risque 20 cM 10 cM ≤1 cM

BC 5 % 1.5 1.6 1.8

BC 1 % 2.2 2.3 2.6

F2 5 % 2.2 2.3 2.6

F2 1 % 2.9 3.1 3.4

longueur du groupe de liaison : 2 M

BC 5 % 1.8 1.9 2.1

BC 1 % 2.5 2.6 3.0

F2 5 % 2.4 2.6 3.0

F2 1% 3.2 3.4 3.8

(21)

Principe des permutations

en permutant les ph ´enotypes,

on casse la

corr ´elation en- tre g ´enotype et ph ´enotype, on cr ´ee donc un

´echantillon sous l’hypoth `ese nulle

(22)

D’autres mod ´elisations

Plusieurs QTL

Effet du QTL al ´eatoire (animaux)

Effet polyg ´enique al ´eatoire (animaux) ou effet fond g ´en ´etique fixe (plantes)

Effet d’ ´epistasie (interaction) entre QTLs

Effet d’ ´epistasie (interaction) entre un QTL et le fond g ´en ´etique

QTL en pl ´eiotropie ....

(23)

Diall `ele de lign ´ees homozygotes

(24)

Pedigrees complexes

Familles de demi-fr `eres

(25)

Pedigree humain

(26)

Les logiciels

Pour les QTL

l’anc ˆetre : MAPMAKER/QTL le cl ´e en main : QTL carthographer le payant : mapQTL

le futur : R/qtl

“les sp ´ecialis ´es”

pour les pedigrees et mod `eles animaux : QTLMap pour plusieurs descendances : MCQTL

Références

Documents relatifs

Let (~a: hEH~} be an arbitrary collection o/positive numbers indexed over H~. Let 9~ be the directed set consisting of all finite subsets of Hg ordered by inclusion.. We shall

Thus, T(G) and S(G) are different generalizations of the notion of Teichmiiller space to groups of the second kind.. Indeed, the region of discontinuity D of G

Tout d’un coup, Nicolas s’affole car une guêpe lui tourne autour!. I l s’agite tellement qu’il finit par avoir du gâteau sur toute

[r]

Les paires s ´egr `egent (se s ´eparent) dans les gam `etes, la moiti ´e des gam `etes portant un g `ene, l’autre moiti ´e portant l’autre g `ene?. Taille de plante (all

Les ph ´enotypes continus : le mod `ele le plus simple Les ph ´enotypes continus : corriger de la structure Les ph ´enotypes continus : corriger de la structure et de

= ⇒ lier un caract `ere binaire ou quantitatif (ph ´enotype) `a un endroit du g ´enome (g ´enotype au g `ene ou au QTL) dans la descendance d’un croisement, o `u les individus ont le

Autrement dit, une variable al´ eatoire X est discr` ete si et seulement si X prend (presque sˆ urement) ses valeurs dans un ensemble fini ou d´ enombrable E.. La plupart du temps,