CONSANGUINITÉ PANMICTIQUE
ET CONSANGUINITÉ SYSTÉMATIQUE
(COEFFICIENTS
DEWRIGHT
ET DEMALÉCOT)
G.
MALÉCOT
Université de
Lyon (la Doua),
Mathématiques appliquées,
B. P. n° 37,6 9 -Villeurbanne-Cha y pennes
SOMMAIRE
Dans des
populations diploïdes qui
sont soumises à un certain isolementgéographique
matérialisé par l’existence de « subdivisions t ou a sites », il est
possible
de définir 3 coefficients deconsanguinité :
F et x de S. WRIGHTetde
MALÉCOT. Fs’appelle
coefficient deconsanguinité totale,
a coefficient deconsanguinité systématique
et w coeflicient deconsanguinité panmic- tique.
En utilisant la relation entre corrélations conditionnées(sur
des sites où lacomposition
du réservoir
gamétique
estconnu)
et corrélations apriori (pour
un ensemble nombreux de sites dont les réservoirsgamétiques
individuels sontinconnus)
on démontre que F = a+
ey - acp.Cette relation avait
déjà
été énoncée par S. WRIGHT comme théorème dea multiplication
des indexpanmictiques
» dans une classification *hiérarchique
s où lapopulation
totale estdécomposée
en a subdivisions ».S. WRIGHT
(1965)
a montré que le « coefficient deconsanguinité
» d’un individudiploïde I,
c’est-à-dire la corrélation entre lesgamètes qui,
dans un sitegéographique
déterminé(désigné
par
x)
s’unissent pour former undiploïde I,
a des valeursnumériques
différentes(oc
ouF) ( 1 )
suivant que l’on
prend
pourespérance mathématique
dechaque
aléatoiregamétique
la moyenne locale(fréquence génique
localeq)
ou la moyennegénérale (moyenne C,
calculée sur l’étendue laplus grande possible,
c’est-à-dire sur l’ensemble de lapopulation,
desfréquences géniques).
Nous avons introduit la notion de *réservoir
gamétique
local» (dans
le sitegéographique x)
pourdésigner
l’ensemble de tous lesgamètes disponibles
dans le site x(M AL É COT , 1960).
Seuleune faible
portion
de cesgamètes (les
«gamètes utiles »)
est utilisée pourproduire
lesdiploïdes qui
naissent dans le site x. Il y aa panmixie
locale» lorsque
les deuxgamètes qui
s’unissent(’)
En notation de MORTON. Dans la notation de WRIGHT, ce =F IS
et F =F IT ;
S(«
subdivision n ou« site
») désigne
le réservoirgamétique
local et T(«
totalité»)
l’ensemble de lapopulation (gamétique
ouzygotique,
car lesfréquences
sont les mêmes dans les deux cas, en vertu de la loi desgrands nombres).
pour former
chaque diploïde
sont tirés au sortindépendamment :
alors leur corrélation a condi- tionnée par la connaissance du réservoirgamétique
local(défini
par lafréquence génique
localeq)
est
nulle,
et leur corrélation «a priori
n F(calculée
dansl’ignorance
de q, donc dansl’ignorance
de la
composition
du réservoirpanmictique local)
se réduit à laprobabilité
apriori w xx (n) (’)
pour que deux
gamètes pris indépendamment
dans le même site xlorsque
ngénérations
serontécoulées soient
identiques :
cetteprobabilité
est le casparticulier (pour
y =x)
de ce que nous avonsappelé
le « coefficient deparenté
,) ’l’&dquo;,y (n) (M AL É COT , 1960),
c’est-à-dire de laprobabilité
a
priori
pour que deuxgamètes, pris respectivement
etindépendamment
dans les sites x et ylorsque
ngénérations
serontécoulées,
soientidentiques.
Nous avons montré ailleurs
(M AL É COT , 1967)
comment ’l’&dquo;,(n)
est calculable( 1 ) lorsque
l’on connaît le nombre 2N degamètes
utiles tirés au sort danschaque
site et les taux d’immi-gration qui,
àchaque génération,
transfèrent dans le réservoirgamétique
local desgènes
exté-rieurs. En
particulier
ces calculs fournissentox x (n) qui
est > 0 etqui peut,
pour la raison indi-quée plus haut,
êtrequalifié
de« consanguinité panmictique
»; sa valeur stationnaireest,
enbref,
notée cp.Lorsqu’il n’y
a paspanmixie locale,
mais « unionpréférentielle
n desgamètes
etlorsque
cetteunion
préférentielle peut
êtreexprimée
par une valeur déterminée a du coefficient de corrélation conditionné(connaissant
le réservoirpanmictique local),
oc seraappelé
la «consanguinité systématique
».Le
présent
travail est consacré à établir la relation entre le coefilcient F(corrélation
apriori
entre les
gamètes qui
s’unissent ou « coefficient deconsanguinité
apriori
» ou econsanguinité totale »)
et les coefficients o et a(w consanguinité panmictique
» et «consanguinité systématique n).
Utilisée pour la définition du coefficient de
parenté !y(n),
la notion d’identité - ou de nonidentité - de 2
gamètes,
ouplutôt
de 2 locihomologues portés
par deuxgamètes,
demandeà être
précisée soigneusement.
Nous dirons d’abord que deux loci sontidentiques
s’ilsdérivent,
par descendance mendélienne et sans aucune mutation, d’un même locus d’un ancêtre commun :dans ce cas ils
portent
forcément le mêmegène :
soit tous deux a, avecprobabilité
apriori C,
soit tous deuxA,
avecprobabilité
1 -C;
le cas contraire(de
e non-identité»)
est-celui où les deuxloci,
ou bien ont subi au moins une mutationdepuis
un ancêtre commun, ou bien n’ont aucunancêtre commun aussi loin que l’on remonte en
arrière,
c’est-à-direjusqu’à
lagénération F.
incluse;
dans ce dernier cas, les deux lociproviennent
d’individus différents deF&dquo;
donc(s’il n’y
a pas desélection)
de deux individuspris
au hasardindépendamment
et que nous suppo-serons sans
parenté:
les deux loci sont alorsindépendants.
Par contre, dans le cas où il y a eu au moins une
mutation, l’indépendance
nepeut
êtreadmise;
il y a au contraire entre les deux loci unedépendance qui
ne donne le même résultat que l’identité quelorsque,
dans le cas dediallélisme,
il s’est effectué un nombrepair
de mutations(G ILLOIS
. 1966).
Une voie de calculplus simple permet
de se ramenerquand
méme à l’indé-pendance
en introduisant la notion de « bétamtitation »: ils’agit
là d’un mécanisme mathéma-tique équivalent
à la mutation de a vers A ou de A vers a avec uneprobabilité
u ou v.Suppo-
sons que -
toujours
dans la transmission d’un locus d’unegénération
à la suivante - il y aitune
probabilité
k de transformation dugène présent
dans le locus en ungène qui soit,
nonplus
forcément
différent,
mais tiré au hasard avecprobabilités
C et 1 - C d’être a ou A.Dès lors la
probabilité,
pourchaque gène
A de se transformer par ce mécanisme en ungène
asera
kC,
que nouségalons
à v; laprobabilité,
pourchaque gène
a, de se transformer en ungène A,
v v sera
k(1-C),
que nouségalons
à u : cela estpossible
à condition quek = u + V et ! k = ! u + v = k u + v C,
ce
qui
est réalisélorsque
n est assezgrand
pour que laprobabilité
apriori
C ait atteint sa valeurd’équilibre !.u + u
Dans
la notation de WRIGHT,o_(n)
FST, Ssymbolisant
ici le « choix au hasard dans le même site. &dquo;(’)
Si n est assezgrand o_ (01) et. o x y(01)
sontindépendants
de n et leursproduits
parC(i
-C)
sont la variance et la covariance ,desfréquences géniques
dans l’état « stationnaire d’équilibrestatistique.
On
peut
donc alorsregarder
k = u + v, comme laprobabilité
àchaque changement
degénération
d’une t bétamutations, mutation
fictive transformant legène
en ungène indépen-
dant tiré dans un réservoir de
composition
constante(définie
parC).
Nous redéfinirons donc le coefficient de
parenté cp&dquo; !(n)
de deux loci en x et y, comme laprobabilité
apriori
pourqu’ils dérivent,
sans avoir subi debéfamutation,
d’un même locus d’un ancêtre commun, c’est-à-dire soientidentiques : ’P &dquo;,.(n)
est uneprobabilité
d’identité.La
probabilité complémentaire
1 —!xr(n)
est alors laprobabilité qu’ils
dérivent d’ancêtresindépendants (dans F O )
ou bienqu’ils
aient subi des bétamutations les rendantindépendants;
C’est une
probabilité d’indépendance
si tous lestirages indépendants
ont lieu dans le même réservoir et si l’on admet que n est assezgrand
pour que laprobabilité
apriori (pour
untirage)
ait atteint sa limite C.En
particulier ’Pn (n)
est laprobabilité
apriori
d’identité de deuxgamètes pris
au hasarddans le même
emplacement
x dansF &dquo;; donc,
dansl’hypothèse
depanmixie locale (’),
la pro- babilité d’identité des deuxgamètes
utiles se réunissant pour fournir unindividu, probabilité
que nous avons
appelée
le coefficient deconsanguinité (M AL É COT , 1948).
Dans le casd’identité,
ces deux
gamètes
ont donc laprobabilité
apriori
C d’être tous deuxporteurs
de a(génotype aa)
et la
probabilité (1 - C)
d’être tous deuxporteurs
de A(génotype AA).
Mais dans le cas d’in-dépendance (cas qui
seprésente
avec laprobabilité
1 -’Pn (n),
lesprobabilités
apriori
des troisgénotypes
sont données par la loi de HARDY-WEINBERG :Les
probabilités
apriori
des troisgénotypes
quepeut présenter
un individu deF. (dans l’emplacement x)
sont donc les suivantes(en allégeant
lesnotations :
pourw xx ) :
Ce
qui
est bien conforme au tableau 1 d’association desgamètes.
Ce sont là les
espérances mathématiques
apriori
desfréquences P, 2Q,
R des troisgénotypes
dans
chaque
groupe, alors que C et(1—C) sont, rappelons-le,
lesespérances
apriori
des fré-quences
q et
p de deuxgènes
a et A danschaque
groupe : si l’onpeut
estimer toutes cesespé-
rances par les
fréquences
moyennes sur ungrand
nombre de groupes, leurcomparaison
donneune estimation du coefficient de
consanguinité 9 ,,(n)
dans le cas depanmixie
locale.( 1
)
C’est-à-direpanmixie
à l’intérieur dechaque
sitegéographique.
(’)
La variable indicatricegamétique prend
la valeur i ou o suivant que legamète porte
legène
aou A.
Ces formules ont été
généralisées
par YASUDA(1966),
en cherchant lesprobabilités
apriori
des six
couples
degénotypes ( 1 ) qui peuvent
seprésenter
chez deuxconjoints (tabl. 2).
En les
regardant
comme lesprobabilités
relatives à un aquadruplet
9 degamètes
de mêmesite
géographique,
on obtient despolynômes
du 4edegré
en C et 1—C dont les coefficients sont lesprobabilités
apriori
des diverses relations d’identité oud’indépendance
entrequatre
locide même site
géographique.
Ces «coefficients deparenté quaternaires
» ont été calculés par GILLOIS
(1964)
et HARRIS(1964)
dans le cas où iln’y
a pas demigration (’).
Ce n’est que par
approximation, si
estpetit,
que lesprobabilités
apriori
des sixcouples
de
conjoints (et
leursfréquences moyennes) peuvent
êtreexprimées
en fonction de (p, les autres coefficients deparenté
étant de l’ordre de Q2 et 91.Revenant au coefficient de
parenté
binaire’ l’ xx (n),
ilexprime
la a corrélationgamétique
a
priori
» entre deuxgamètes
de mêmeemplacement
x, donc enparticulier,
dans le cas de pan- mixielocale,
entre lesgamètes qui
s’unissent. La démonstration est immédiate : les variables indicatricesgamétiques
X et X’ attachées à deuxgamètes pris
au hasard dans le mêmeempla-
cement x ont
chacune, rappelons-le,
pour loi deprobabilité
apriori 1 /(C); 0 /(1—C) (cf.
tabl.1)
et pour
écart-type C(1-C);
leurcovariance,
calculée àpartir
du tableau1,
est!C(l—C),
leur coefficient de corrélation est donc ’l’xx,
c. q. f. d. (théorème
deW RIGHT -IVI AL É COT ).
Il est
important
de remarquer que c’est une corrélation apriori
et non une corrélation conditionnée. Eneffet, lorsqu’on
tire au hasard etindépendamment
deuxgamètes
dans ceréservoir
gamétique
local(panmixie locale)
leur corrélation conditionnée est nulle(la
loi deH ARDY -W EINBERG
est localement
vérifiée).
Iln’y
a pas là de contradiction avec le fait que leur corrélation apriori ’ l’ xx (n)
estpositive,
carl’interprétation expérimentale
de cette dernière est différente. C’est la corrélation entre les écarts de deux variablesgamétiques
X etX’,
tiréesau hasard dans le même site
géographique,
parrapport
à leurespérance
apriori qui peut
souvent être estimée par la moyennegénérale
sur l’ensemble des sitesgéographiques (alors
que la corré- lation conditionnée était calculée parrapport
à la moyennelocale,
définie par lacomposition
du réservoir
gamétique local). ’l’ xx (n)
caractérise ce que l’onpeut appeler w consanguinité
pan-mictique
» ou, avec LAMOTTE(1951),
oconsanguinité
deposition
»., Ce
phénomène présente
unaspect plus général,
dont la formulationrigoureuse
n’est pas encoreexplicitée :
1 Si l’on évalue le coefficient de corrélation par
rapport
à la moyenne sur une vasterégion,
entre deux
gamètes
tirés dans une mêmesous-région,
ce coefficient est d’autantplus grand
que lasous-région
est restreinte parrapport
à larégion.
A lalimite,
il est nulquand
lasous-région
coïncide avec larégion
et il est maximum au contrairequand
lasous-région
est assezpetite
pourcorrespondre
à un réservoirgamétique unique (a
groupepanmictique
» ou » isolatt).
( 1
)
Dans le cas depanmixie
locale.2° En fait
(voir
les données brésiliennes nonpubliées
de Moaxorr(’))
on nepeut
pas observer desous-région
assezpetite
pourcorrespondre
à un groupepanmictique unique,
parcequ’il
y atoujours, semble-t-il,
une tendancepréférentielle
en faveur du choix de cousins(proches
ou éloi-gnés) :
la valeur maximum de cp,soit
’l’&dquo;&dquo;(consanguinité
due au hasard ou a coefficient deconsanguinité panmictique »)
est de l’ordre de 5 p. 1000 alors que le coefficient deparenté
mesuréentre
conjoints (coefficient
deconsanguinité total)
est de l’ordre de 10 p.1000;
la différencecorrespond
à un choixpréférentiel
degamètes (homogamie)
à l’intérieur dechaque
groupelocal,
c’est-à-dire à une corrélation conditionnée(par
la connaissance de cegroupe) qui
restepositive (environ
5 p.1000)
et se traduit localement par un écart à la loi de HARDY-WEINBERG(déficit d’hétérozygotes).
3° C’est WRIGHT
(1965) qui
a donné la meilleure formulation de l’incidence de la non-panmixie
parhomogamie locale;
la voicisimplifiée :
si l’onappelle
a le coefficient de corrélation conditionné(c’est-à-dire
évalué parrapport
à la moyenne connue d’un groupelocal)
desgamètes qui
s’unissent deux à deux dans ce groupe, et si lesfréquences qui
y sont réalisées sont p et q, laprobabilité
conditionnée pour que lecouple
degamètes qui
s’unissent donne unhétérozygote est,
non pas2pq,
mais2p ? (l—x) :
c’estaussi, sensiblement,
lafréquence
deshétérozygotes
dansce groupe; donc leur
fréquence
moyenne sur l’ensemble de tous les groupes d’une vasterégion
sera sensiblement
E[2p ? (l—<x)]. Or,
dans l’étatstationnaire,
on a :E(pq)
=E(q- - q 2 )
=C-C’-a x
=C(1-C)(1-cp)
La
fréquence
moyenne deshétérozygotes
sur l’ensemble de la vasterégion
sera donc :2C(1-C)(1-o)(1-ce)
alors que lafréquence
moyenne dugène
a est C. Lacomparaison
montreque le coefficient de corrélation entre les
gamètes qui s’unissent,
calculé parrapport
à la moyennegénérale (coefficient
de corrélation apriori
entre lesgamètes qui s’unissent)
est F tel que : 1— F =(1-cp) (1—<t),
soit F = ’1’+
a - qaC’est le théorème de WRIGHT énoncé par cet auteur
(1965)
comme théorème de a multi-plication
des indexpanmictiques
»(1-ce)
et(1-cp)
dans une e classificationhiérarchique
» oùla
population
totale » estdécomposée
en « subdivisions s(ou
sites»).
La
présente
démonstration relie directement les corrélations a et F(qui peuvent
varier de- à
à -!-1)
à laprobabilité p (qui
estcomprise
entre 0 et1)
etqui
est aussiinterprétable
commeune corrélation
(positive)
entre deuxgamètes pris indépendamment
dans le même site» (dans
la même subdivision
»).
Signalons quelques
casparticuliers : :siK==l,F=l;siot=0,F=!;sio[= -1,
F = 2!—1.Il y a une autre
interprétation :
lecomplément
à 1 d’un coefficient deconsanguinité
a étéappelé
par WRIGHT« indexpanmictique
t : la formule de WRIGHTcorrespond
au cas où les indexpanmictiques
semultiplient :
1 - a est laprobabilité d’indépendance
conditionnée par la con- naissance de lafréquence locale;
1 - cp est laprobabilité d’indépendance
de deuxgamètes pris
au hasard dans un même groupe local par
rapport
à la moyennegénérale.
Leproduit
1 --- Fest la
probabilité d’indépendance
des deuxgamètes qui
s’unissent parrapport
à la moyennegénérale.
Reçu pour publication
enjuillet - 9 6 9 .
SUMMARY
RANDOM INBREEDING AND NONRANDOM INBREEDING
In
diploid populations
whichundergo
a certaingeographic
isolation manifestedby
the exis-tence of subdivisions or
sites,
it ispossible
to define three coefficients ofinbreeding:
F and «of Sewall
Wright
and of Malecot. F is called the coefficient of totalinbreeding,
at the coeffi- cient of nonrandominbreeding,
and the coefficient of randominbreeding. By using
a relationbetween conditional correlation coefficients
(on
sites where thecomposition
of the genepool
is
known)
and apriori
correlations(for
alarge
number of sites whose individualgametic
reservoirsare
unknown),
it can be shown that F = « !- - oe. That relation hadalready
beenput
forward
by
SewallWright
as a theorem of omultiplication
ofpanmictic
indices in a hierarchical classification where the totalpopulation
ispartitioned
into subdivisions.( i
)
Prof. E. N. MORTON, Institute ofGenetics, University
ofHawaii, Honolulu,
Hawaii(U.S.A.).
RÉFÉRENCES BIBLIOGRAPHIQUES
Gxraoxs M., 19 66.
I,a notion dedépendance
engénétique.
Ann. Inst. HenriPoincaré,
Sect.B, 2, 2 6 1 - 27 8.
E IAP3
OE D.
I,., 19 6 4 . Genotypic
covariances between inbred relatives.Genetics, 50, x 3 xç-x 34 8.
lAmoTTEK,ig5i.
Itecherclies sur la structuregénétique
despopulations naturelles
deCepm
Nemoralis L.Bull. biol. Fr.
Belg., Suppl.
n° 35.Mnr.!cox
G., 194 8.
Lesmathématiques
de l’hérédité. Masson, Paris.M ALÉ
coT