• Aucun résultat trouvé

2.2 Structure en classes d’individus

2.3.1 D´ efinitions

Lorsque les croisements se font localement au hasard, dans un mod`ele `a

nombre d’ˆıles infini, seules trois probabilit´es d’identit´e sont n´ecessaires pour

d´ecrire l’ensemble des ´equations de transition des probabilit´es d’identit´e `a

deux locus (Whitlocket al.1993). Dans la suite de ce chapitre, j’utiliserai le

termehaplotype pour d´ecrire un ensemble de deux g`enes ´echantillonn´es dans

un seul individu `a deux locus distincts, qui provient d’un mˆeme et unique

gam`ete `a la g´en´eration pr´ec´edente. On notera que les deux locus ne sont pas

n´ecessairement localis´es sur le mˆeme chromosome. φ

RM

est d´efini comme la

probabilit´e que deux haplotypes tir´es au hasard dans une population soient

identiques aux deux locus

23

. γ

RM

est la probabilit´e que, lorsque l’on tire

trois haplotypes au hasard, deux soient identiques au premier locus, tandis

que le troisi`eme haplotype est identique `a l’un des deux autres haplotypes

au second locus. δRM est la probabilit´e que, parmi quatre haplotypes, deux

soient identiques au premier locus, tandis que les deux autres sont identiques

au second locus. Ces diff´erentes probabilit´es d’identit´e sont sch´ematiquement

23L’indiceRM vaut pourRandom Mating qui signifie que les croisements se font

repr´esent´ees sur la figure 2.11.

En quoi ces trois probabilit´es d’identit´e sont-elles n´ecessaires pour d´

e-crire l’ensemble des relations d’identit´e de deux paires de g`enes `a deux

lo-cus distincts ? Prenons, par exemple, la probabilit´eφRM. Avec la probabilit´e

(1− m)

2

(1− 1/N) une paire d’haplotypes ´echantillonn´ee dans une

sous-population est issue de parents distincts `a la g´en´eration pr´ec´edente. Mais ces

deux haplotypes peuvent ˆetre tous les deux de type recombinant

24

ou bien

tous les deux de type parental

25

, ou bien encore l’un peut ˆetre de type

recom-binant et l’autre de type parental. Ceci implique que le nombre d’haplotypes

`

a consid´erer `a la g´en´eration pr´ec´edente est de 4, 2 ou 3, respectivement.

Par cons´equent, ces haplotypes sont identiques avec une probabilit´e ´egale `a

[(1−r)

2

φ

RM

+ 2r(1−r)γ

RM

+r

2

δ

RM

]. Avec la probabilit´e (1−m)

2

/N une

paire d’haplotypes ´echantillonn´ee dans une sous-population est issue d’un

unique parent `a la g´en´eration pr´ec´edente. Ces deux haplotypes sont tous les

deux de type recombinant ou tous les deux de type parental en proportion

[(1−r)

2

+r

2

]. Dans les deux cas, les haplotypes ´echantillonn´es (c’est-`a-dire

les gam`etes produits par le parent) peuvent ˆetre deux copies d’un seul

haplo-type ou bien d’haplohaplo-types distincts et sont donc identiques avec la probabilit´e

RM

+1)/2. Avec la probabilit´e [2r(1−r)], en revanche, l’un des deux

haplo-types ´echantillonn´es est de type recombinant et l’autre est de type parental.

Ils sont donc n´ecessairement des copies distinctes des haplotypes parentaux

et ne peuvent ˆetre identiques qu’`a un locus, avec la probabilit´eQRM. Le

rai-sonnement peut ˆetre poursuivi pour ´ecrire les ´equations de r´ecurrence pour

les probabilit´es γ

RM

etδ

RM

.

Autof´econdation partielle

Lorsque les croisements ne se font pas au hasard, par exemple chez des

esp`eces dio¨ıques ou bien des esp`eces qui s’autof´econdent, ces trois probabilit´es

d’identit´e ne suffisent pas `a d´ecrire compl`etement l’ensemble des relations

24On dit d’un haplotype qu’il est de typerecombinant s’il est le produit de la

recombi-naison des deux haplotypes du parent dont il est issu.

25On dit d’un haplotype qu’il est de type parental s’il est la copie de l’un des deux

δ δ3 δ4 δ0 δ00

φ φ

0

γ γ

3

γ

0

Figure 2.12:D´efinition des probabilit´es d’identit´e `a deux locus pour

un r´egime de reproduction mixte. Les lignes verticales repr´esentent

les haplotypes ´echantillonn´es, o`u les locus sont figur´es par un cercle

noir. Les individus sont repr´esent´es par un rectangle. Le symbole ≡

d´efinit l’identit´e entre paires de g`enes homologues.

d’identit´e entre paires de g`enes `a deux locus. En d’autres termes, cela signifie

que chacune de ces probabilit´es d’identit´e prend une valeur diff´erente, selon

qu’elle est ´evalu´ee parmi des paires, des triplets ou bien des quadruplets

d’individus (Weir et al. 1980; Weir et Cockerham 1969; Weir et Hill

1980b). Les dix probabilit´es d’identit´e `a deux locus qui sont n´ecessaires et

suffisantes pour d´ecrire l’ensemble des relations d’identit´e entre paires de

g`enes `a deux locus sont repr´esent´ees sch´ematiquement dans la figure 2.12.

Je n’en d´etaillerai ici qu’une partie. φ, γ etδ correspondent exactement aux

probabilit´esφ

RM

RM

etδ

RM

d´efinies plus haut, lorsque les haplotypes sont

´echantillonn´es dans des paires d’individus. δ

4

est la probabilit´e que, parmi

quatre haplotypes ´echantillonn´es dans quatre individus distincts, deux soient

identiques au premier locus, tandis que les deux autres soient identiques au

second locus.

Il n’est pas possible en pratique, `a partir des seules donn´ees g´enotypiques,

d’estimer chacune de ces probabilit´es d’identit´e. La raison en est que l’on ne

distingue en g´en´eral pas les cas o`u les g`enes `a deux locus sont en phase, ou

bien enr´epulsion. On dit en g´en´eral de deux g`enes pris `a deux locus distincts

dans un mˆeme individu qu’ils sont en phase si les deux locus sont

position-n´es sur le mˆeme chromosome. On ´etendra ici cette d´efinition au cas o`u deux

g`enes, ´echantillonn´es dans un individu `a deux locus distincts, appartiennent

`

a un unique haplotype (c’est-`a-dire sont h´erit´es d’un seul parent). De mˆeme

on dira ici que deux g`enes, ´echantillonn´es dans un individu `a deux locus

distincts, sont en r´epulsion s’ils proviennent de gam`etes parentaux distincts.

Par exemple, lorsque deux individus portent des all`eles identiques `a deux

locus distincts, il n’est en g´en´eral pas possible de d´eterminer si les all`eles

d’un mˆeme individu proviennent d’un seul gam`ete parental ou de deux. En

d’autres termes, il n’est pas possible de d´eterminer si les probabilit´es

d’iden-tit´e sont de type φ, γ ouδ. Par cons´equent, nous avons d´efini la probabilit´e

d’identit´e composite Φ comme ´etant la probabilit´e qu’`a deux locus, les g`enes

´echantillonn´es dans deux individus distincts soient identiques. Deux paires

de g`enes ´echantillonn´ees `a deux locus distincts peuvent ˆetre port´ees par 2,

3 ou 4 haplotypes. Ces trois cas correspondent aux probabilit´es d’identit´e

φ, γ ou δ (voir la figure 2.12). Lorsque l’on ´echantillonne toutes les paires

possibles de g`enes `a deux locus distincts, ces trois « configurations»sont en

proportion 1/4, 1/2 et 1/4, respectivement. Par cons´equent,

Φ = φ+ 2γ+δ

4 (2.30)

Le d´es´equilibre d’identit´e

Ohta (1980) a d´efini une mesure d’association g´en´etique `a plusieurs

sites dans des s´equences de prot´eines. Cette mesure est d´efinie comme

l’ex-c`es d’identit´e conjointe `a deux sites, par rapport `a l’attendu sous

l’hypo-th`ese d’ind´ependance des probabilit´es d’identit´e `a deux sites. Cette quantit´e

est ´equivalente `a la covariance des probabilit´es de non-identit´e `a deux

lo-cus (Avery et Hill 1979; Hedrick 1987). Nous avons d´efini une mesure

analogue, que l’on nommera « d´es´equilibre d’identit´e», not´e η

S

, comme la

diff´erence entre la probabilit´e conjointe d’identit´e `a deux locus (entre deux

in-dividus de la mˆeme sous-population) et le produit des probabilit´es d’identit´e

`

a chacun de ces locus soit, pour deux locus i etj

(voir l’annexe E). Cette quantit´e, qui peut ˆetre d´efinie comme la covariance

des probabilit´es d’identit´e entre locus, est une fonction simple des probabilit´es

d’identit´e `a deux locus. Il s’agit donc bien d’un param`etre, lui mˆeme

fonc-tion de certains param`etres du mod`ele de populations subdivis´ees (nombre

d’individus, taux de migration) mais ´egalement du mod`ele de mutation. Une

d´efinition alternative du d´es´equilibre d’identit´e nous est donn´ee par

η

S,ij0

= Φ

ij

−δ

4ij

(1−Q

2i

)(1−Q

2j

) (2.32)

(voir, par exemple, Hedrick 1987; Ohta 1980; Takahata 1982). Nous

verrons par la suite l’int´erˆet d’une telle d´efinition.

Relation au d´es´equilibre de liaison

Si l’on noteP

vu

la fr´equence des gam`etes qui portent l’all`ele uau premier

locus et l’all`elev au second locus, ainsi queP

u

etP

v

les fr´equences des all`eles

u et v au premier et au second locus, respectivement, alors le d´es´equilibre

de liaison est d´efini par D

u

v

=P

u

v

−P

u

·P

v

. Ainsi, le d´es´equilibre de liaison

entre deux locus est d´efini comme l’exc`es des gam`etes portant les all`eles u

et v par rapport `a ce que l’on attend sous l’hypoth`ese que l’association des

all`eles aux diff´erents locus se fait au hasard.

Le d´es´equilibre de liaison E(D) entre des locus neutres tend vers z´ero

dans des populations de taille infinie (Bennett 1954) ou bien de taille

fi-nie (Hill et Robertson 1966), quel que soit le nombre de locus consid´er´e

(Hill1974a) et le r´egime de reproduction (BennettetBinet1956; Weir

et Cockerham 1973). Dans les populations subdivis´ees, le d´es´equilibre de

liaison ne peut exister que de fa¸con transitoire (Nei 1973; Slatkin 1975)

et finit par disparaˆıtre (Nei 1973;Ohta 1982a,b). En revanche, bien que le

d´es´equilibre de liaison converge vers la valeur z´ero dans tout mod`ele neutre

la variance du d´es´equilibre de liaison entre les lign´ees qui s´egr`egent peut ˆetre

tr`es grande, en particulier dans les populations de petite taille (Hill 1974b;

Hill et Robertson 1968; Ohta et Kimura 1969; Sved 1968; Weir et

ecom-0.01 0.1 1 10 100

0

0.01

0.02

0.03

0.04

0.05

Nr

Déséquilibre d'identité

η (2 allèles)

η (5 allèles)

η (10 allèles)

η' (KAM et IAM)

et η (IAM)

Figure 2.13: D´es´equilibre d’identit´e attendu sous diff´erents mod`ele

de mutation. Les croisements se font au hasard dans chaque

sous-population (s = 1/N). Noter l’´echelle logarithmique en abscisses.

µ= 10

−6

, N = 200 et N m = 1. L’intensit´e de la recombinaison est

donn´ee par la valeur du produit N r.

pos´ee pour tenir compte de la structure d’une population subdivis´ee (Ohta

1982a,b). Ces diff´erentes composantes peuvent s’exprimer en fonction des

probabilit´es d’identit´e `a deux locus simultan´ement (Tachida et

Cocke-rham1986), telles que celles d´efinies dans la figure 2.12. Ainsi, le d´es´equilibre

d’identit´e d´efini par les ´equations (2.31) ou (2.32) est une mesure analogue `a

la variance du d´es´equilibre de liaisonE(D

2

).