2.2 Structure en classes d’individus
2.3.1 D´ efinitions
Lorsque les croisements se font localement au hasard, dans un mod`ele `a
nombre d’ˆıles infini, seules trois probabilit´es d’identit´e sont n´ecessaires pour
d´ecrire l’ensemble des ´equations de transition des probabilit´es d’identit´e `a
deux locus (Whitlocket al.1993). Dans la suite de ce chapitre, j’utiliserai le
termehaplotype pour d´ecrire un ensemble de deux g`enes ´echantillonn´es dans
un seul individu `a deux locus distincts, qui provient d’un mˆeme et unique
gam`ete `a la g´en´eration pr´ec´edente. On notera que les deux locus ne sont pas
n´ecessairement localis´es sur le mˆeme chromosome. φ
RMest d´efini comme la
probabilit´e que deux haplotypes tir´es au hasard dans une population soient
identiques aux deux locus
23. γ
RMest la probabilit´e que, lorsque l’on tire
trois haplotypes au hasard, deux soient identiques au premier locus, tandis
que le troisi`eme haplotype est identique `a l’un des deux autres haplotypes
au second locus. δRM est la probabilit´e que, parmi quatre haplotypes, deux
soient identiques au premier locus, tandis que les deux autres sont identiques
au second locus. Ces diff´erentes probabilit´es d’identit´e sont sch´ematiquement
23L’indiceRM vaut pourRandom Mating qui signifie que les croisements se font
repr´esent´ees sur la figure 2.11.
En quoi ces trois probabilit´es d’identit´e sont-elles n´ecessaires pour d´
e-crire l’ensemble des relations d’identit´e de deux paires de g`enes `a deux
lo-cus distincts ? Prenons, par exemple, la probabilit´eφRM. Avec la probabilit´e
(1− m)
2(1− 1/N) une paire d’haplotypes ´echantillonn´ee dans une
sous-population est issue de parents distincts `a la g´en´eration pr´ec´edente. Mais ces
deux haplotypes peuvent ˆetre tous les deux de type recombinant
24ou bien
tous les deux de type parental
25, ou bien encore l’un peut ˆetre de type
recom-binant et l’autre de type parental. Ceci implique que le nombre d’haplotypes
`
a consid´erer `a la g´en´eration pr´ec´edente est de 4, 2 ou 3, respectivement.
Par cons´equent, ces haplotypes sont identiques avec une probabilit´e ´egale `a
[(1−r)
2φ
RM+ 2r(1−r)γ
RM+r
2δ
RM]. Avec la probabilit´e (1−m)
2/N une
paire d’haplotypes ´echantillonn´ee dans une sous-population est issue d’un
unique parent `a la g´en´eration pr´ec´edente. Ces deux haplotypes sont tous les
deux de type recombinant ou tous les deux de type parental en proportion
[(1−r)
2+r
2]. Dans les deux cas, les haplotypes ´echantillonn´es (c’est-`a-dire
les gam`etes produits par le parent) peuvent ˆetre deux copies d’un seul
haplo-type ou bien d’haplohaplo-types distincts et sont donc identiques avec la probabilit´e
(φ
RM+1)/2. Avec la probabilit´e [2r(1−r)], en revanche, l’un des deux
haplo-types ´echantillonn´es est de type recombinant et l’autre est de type parental.
Ils sont donc n´ecessairement des copies distinctes des haplotypes parentaux
et ne peuvent ˆetre identiques qu’`a un locus, avec la probabilit´eQRM. Le
rai-sonnement peut ˆetre poursuivi pour ´ecrire les ´equations de r´ecurrence pour
les probabilit´es γ
RMetδ
RM.
Autof´econdation partielle
Lorsque les croisements ne se font pas au hasard, par exemple chez des
esp`eces dio¨ıques ou bien des esp`eces qui s’autof´econdent, ces trois probabilit´es
d’identit´e ne suffisent pas `a d´ecrire compl`etement l’ensemble des relations
24On dit d’un haplotype qu’il est de typerecombinant s’il est le produit de la
recombi-naison des deux haplotypes du parent dont il est issu.
25On dit d’un haplotype qu’il est de type parental s’il est la copie de l’un des deux
δ δ3 δ4 δ0 δ00
φ φ
0γ γ
3γ
0Figure 2.12:D´efinition des probabilit´es d’identit´e `a deux locus pour
un r´egime de reproduction mixte. Les lignes verticales repr´esentent
les haplotypes ´echantillonn´es, o`u les locus sont figur´es par un cercle
noir. Les individus sont repr´esent´es par un rectangle. Le symbole ≡
d´efinit l’identit´e entre paires de g`enes homologues.
d’identit´e entre paires de g`enes `a deux locus. En d’autres termes, cela signifie
que chacune de ces probabilit´es d’identit´e prend une valeur diff´erente, selon
qu’elle est ´evalu´ee parmi des paires, des triplets ou bien des quadruplets
d’individus (Weir et al. 1980; Weir et Cockerham 1969; Weir et Hill
1980b). Les dix probabilit´es d’identit´e `a deux locus qui sont n´ecessaires et
suffisantes pour d´ecrire l’ensemble des relations d’identit´e entre paires de
g`enes `a deux locus sont repr´esent´ees sch´ematiquement dans la figure 2.12.
Je n’en d´etaillerai ici qu’une partie. φ, γ etδ correspondent exactement aux
probabilit´esφ
RM,γ
RMetδ
RMd´efinies plus haut, lorsque les haplotypes sont
´echantillonn´es dans des paires d’individus. δ
4est la probabilit´e que, parmi
quatre haplotypes ´echantillonn´es dans quatre individus distincts, deux soient
identiques au premier locus, tandis que les deux autres soient identiques au
second locus.
Il n’est pas possible en pratique, `a partir des seules donn´ees g´enotypiques,
d’estimer chacune de ces probabilit´es d’identit´e. La raison en est que l’on ne
distingue en g´en´eral pas les cas o`u les g`enes `a deux locus sont en phase, ou
bien enr´epulsion. On dit en g´en´eral de deux g`enes pris `a deux locus distincts
dans un mˆeme individu qu’ils sont en phase si les deux locus sont
position-n´es sur le mˆeme chromosome. On ´etendra ici cette d´efinition au cas o`u deux
g`enes, ´echantillonn´es dans un individu `a deux locus distincts, appartiennent
`
a un unique haplotype (c’est-`a-dire sont h´erit´es d’un seul parent). De mˆeme
on dira ici que deux g`enes, ´echantillonn´es dans un individu `a deux locus
distincts, sont en r´epulsion s’ils proviennent de gam`etes parentaux distincts.
Par exemple, lorsque deux individus portent des all`eles identiques `a deux
locus distincts, il n’est en g´en´eral pas possible de d´eterminer si les all`eles
d’un mˆeme individu proviennent d’un seul gam`ete parental ou de deux. En
d’autres termes, il n’est pas possible de d´eterminer si les probabilit´es
d’iden-tit´e sont de type φ, γ ouδ. Par cons´equent, nous avons d´efini la probabilit´e
d’identit´e composite Φ comme ´etant la probabilit´e qu’`a deux locus, les g`enes
´echantillonn´es dans deux individus distincts soient identiques. Deux paires
de g`enes ´echantillonn´ees `a deux locus distincts peuvent ˆetre port´ees par 2,
3 ou 4 haplotypes. Ces trois cas correspondent aux probabilit´es d’identit´e
φ, γ ou δ (voir la figure 2.12). Lorsque l’on ´echantillonne toutes les paires
possibles de g`enes `a deux locus distincts, ces trois « configurations»sont en
proportion 1/4, 1/2 et 1/4, respectivement. Par cons´equent,
Φ = φ+ 2γ+δ
4 (2.30)
Le d´es´equilibre d’identit´e
Ohta (1980) a d´efini une mesure d’association g´en´etique `a plusieurs
sites dans des s´equences de prot´eines. Cette mesure est d´efinie comme
l’ex-c`es d’identit´e conjointe `a deux sites, par rapport `a l’attendu sous
l’hypo-th`ese d’ind´ependance des probabilit´es d’identit´e `a deux sites. Cette quantit´e
est ´equivalente `a la covariance des probabilit´es de non-identit´e `a deux
lo-cus (Avery et Hill 1979; Hedrick 1987). Nous avons d´efini une mesure
analogue, que l’on nommera « d´es´equilibre d’identit´e», not´e η
S, comme la
diff´erence entre la probabilit´e conjointe d’identit´e `a deux locus (entre deux
in-dividus de la mˆeme sous-population) et le produit des probabilit´es d’identit´e
`
a chacun de ces locus soit, pour deux locus i etj
(voir l’annexe E). Cette quantit´e, qui peut ˆetre d´efinie comme la covariance
des probabilit´es d’identit´e entre locus, est une fonction simple des probabilit´es
d’identit´e `a deux locus. Il s’agit donc bien d’un param`etre, lui mˆeme
fonc-tion de certains param`etres du mod`ele de populations subdivis´ees (nombre
d’individus, taux de migration) mais ´egalement du mod`ele de mutation. Une
d´efinition alternative du d´es´equilibre d’identit´e nous est donn´ee par
η
S,ij0= Φ
ij−δ
4ij(1−Q
2i)(1−Q
2j) (2.32)
(voir, par exemple, Hedrick 1987; Ohta 1980; Takahata 1982). Nous
verrons par la suite l’int´erˆet d’une telle d´efinition.
Relation au d´es´equilibre de liaison
Si l’on noteP
vula fr´equence des gam`etes qui portent l’all`ele uau premier
locus et l’all`elev au second locus, ainsi queP
uetP
vles fr´equences des all`eles
u et v au premier et au second locus, respectivement, alors le d´es´equilibre
de liaison est d´efini par D
uv
=P
uv
−P
u·P
v. Ainsi, le d´es´equilibre de liaison
entre deux locus est d´efini comme l’exc`es des gam`etes portant les all`eles u
et v par rapport `a ce que l’on attend sous l’hypoth`ese que l’association des
all`eles aux diff´erents locus se fait au hasard.
Le d´es´equilibre de liaison E(D) entre des locus neutres tend vers z´ero
dans des populations de taille infinie (Bennett 1954) ou bien de taille
fi-nie (Hill et Robertson 1966), quel que soit le nombre de locus consid´er´e
(Hill1974a) et le r´egime de reproduction (BennettetBinet1956; Weir
et Cockerham 1973). Dans les populations subdivis´ees, le d´es´equilibre de
liaison ne peut exister que de fa¸con transitoire (Nei 1973; Slatkin 1975)
et finit par disparaˆıtre (Nei 1973;Ohta 1982a,b). En revanche, bien que le
d´es´equilibre de liaison converge vers la valeur z´ero dans tout mod`ele neutre
la variance du d´es´equilibre de liaison entre les lign´ees qui s´egr`egent peut ˆetre
tr`es grande, en particulier dans les populations de petite taille (Hill 1974b;
Hill et Robertson 1968; Ohta et Kimura 1969; Sved 1968; Weir et
ecom-0.01 0.1 1 10 100
0
0.01
0.02
0.03
0.04
0.05
Nr
Déséquilibre d'identité
η (2 allèles)
η (5 allèles)
η (10 allèles)
η' (KAM et IAM)
et η (IAM)
Figure 2.13: D´es´equilibre d’identit´e attendu sous diff´erents mod`ele
de mutation. Les croisements se font au hasard dans chaque
sous-population (s = 1/N). Noter l’´echelle logarithmique en abscisses.
µ= 10
−6, N = 200 et N m = 1. L’intensit´e de la recombinaison est
donn´ee par la valeur du produit N r.
pos´ee pour tenir compte de la structure d’une population subdivis´ee (Ohta
1982a,b). Ces diff´erentes composantes peuvent s’exprimer en fonction des
probabilit´es d’identit´e `a deux locus simultan´ement (Tachida et
Cocke-rham1986), telles que celles d´efinies dans la figure 2.12. Ainsi, le d´es´equilibre
d’identit´e d´efini par les ´equations (2.31) ou (2.32) est une mesure analogue `a
la variance du d´es´equilibre de liaisonE(D
2).
Dans le document
Génétique des populations subdivisées : théorie et applications
(Page 71-76)