DISTRIBUTION DES FRÉQUENCES DES UNIONS DE DIVERS GÉNOTYPES
DANS U N E POPULATION MONOGAME À EFFECTIF LIMITÉ
E n analysant un modèle de population monogame (DEFRISE- GussENHOVEN, 1964) nous avons été amenée à élaborer une distri
bution de fréquences qui présente quelques analogies avec la dis
tribution multinomiale, mais qui est un peu plus difficile à manier.
Nous voulons exposer l'élaboration et l'étude de cette distribu
tion, d'une part pour justifier l'emploi que nous faisons ailleurs {toc. cit.) de certaines formules et d'autre part parce que le pro
blème à propos duquel la distribution a été établie, peut se poser dans d'autres domaines que celui de la génétique des populations.
1. — D é f i n i t i o n d u m o d è l e d e p o p u l a t i o n m o n o g a m e p a n m i c t i q u e e t e x p o s é d u p r o b l è m e
Considérons un isolât — c'estàdire une population dont les membres s'unissent exclusivement entre eux — caractérisé par la propriété suivante : les unions se font entre sujets se choisissant au hasard, à cela près qu'ils appartiennent à la même génération ; un même nombre n d'hommes et de femmes forment ainsi n couples stables dont les enfants constitueront la génération suivante.
O n reconnaît dans ce modèle, celui qu'utilise DAHLBERG (1947) dans ses études sur la consanguinité.
Le problème qui s'est posé était de calculer, en fonction des fré
par
E . Dé F R I S E - G U S S E N H O V E N ( B r u x e l l e s )
quences des génotypes AA, Aa, aa chez les parents, les fréquences des génotypes chez les enfants.
Supposons q u e chez les parents, il y a, d a n s c h a q u e sexe d sujets de génotype A A
h » » » A a r » » » a a avec d + h + r = n.
Représentons p a r les cases d ' u n échiquier les unions possibles d a n s u n e telle p o p u l a t i o n (fig. 1). U n côté figure les hommes, d o n t d sont de génotype AA, h de génotype Aa et r de génotype a a . L ' a u t r e côté de l'échiquier correspond a u x femmes, avec les m ê m e s fréquences génotypiques.
d A A
hommes
h Aa aa
d A A
g A a
aa r X
X
X V
X
X X
s X ( t )
X
X X X
X X
—1 X
X
fig. 1.
hommes h Aa
ai t)
B
•S
V A A [
t À a | h - V - t aa !
fig. 2.
L a figure 1 correspond au cas particulier p o u r lequel n = 15, d = 4, h = 6, r = 5.
L'ensemble des 15 croix placées dans les cases de l'échiquier re- présente l'une des façons de f o r m e r 15 unions avec ces 15 h o m m e s et ces 15 femmes et c'est de la composition génotypique particulière de ces 15 couples q u e d é p e n d r o n t n a t u r e l l e m e n t les fréquences gé- notypiques des enfants.
Si nous désignons respectivement p a r u, v, s, t le n o m b r e des unions de génotype
$ A A X cî AA, Ç A A X t? Aa, $ Aa X ^ AA, ? Aa x cî Aa, on a, p o u r l'exemple particulier de la figure 1, u = 3, v = 1, s = 0, t = 3.
Puisque c h a q u e sujet se m a r i e mais n ' a q u ' u n seul conjoint, u n e croix et u n e seule occupe c h a q u e ligne et c h a q u e colonne de l'échiquier, de sorte q u e les fréquences des autres types d'unions, se déduisent aisément des valeurs de u, v, s, t.
Il y a
d-u-v = 0 union $ A A X S a a
h-s-t = 3 unions Ç Aa X S a a
d-u-s = 1 union ? aa X S A A
h-v-t = 2 unions $ a a X 3 A a
r-(d-u-s)-(h-v-t) = 2 unions Ç aa X â a a Il existe n a t u r e l l e m e n t d ' a u t r e s façons de former 15 couples ou de placer 15 croix sur l'échiquier p o u r lesquelles on a u r a i t également u = 3, V = 1, s = 0, t = 3, tandis que, p o u r d ' a u t r e s séries de
15 unions, on trouverait, p o u r u, v, s, t, des valeurs différentes.
u, V, s, t, sont des variables aléatoires ; c'est la connaissance de leur espérance m a t h é m a t i q u e , de leur variance et leurs covariances qui nous p e r m e t t r a de calculer les fréquences génotypiques de la génération suivante.
2. — D i s t r i b u t i o n d e f r é q u e n c e s d e u, v, s, t
Les valeurs q u e p e u v e n t p r e n d r e les nombres u, v, s, t ne sont pas i n d é p e n d a n t e s . Ainsi, il est évident q u e u + v ne p e u t pas dépasser d. E n effet, u et v sont les fréquences de couples d a n s lesquels la f e m m e est de g é n o t y p e A A ; c o m m e il n ' y a que d femmes AA, il ne p e u t y avoir plus de d tels couples.
P o u r u n e raison analogue, u + s ^ d , s + t ^ h e t v + t < h . Nous allons établir la répartition simultanée des variables aléa- toires u, V, s, t.
Il y a 15 ! façons différentes de placer 15 croix dans l'échiquier de la figure 1 de m a n i è r e qu'il n ' y ait q u ' u n e croix p a r ligne et p a r colonne ; plus généralement, s'il y a n h o m m e s et n femmes, il y a u r a n ! séries différentes de n couples.
P a r m i ces n ! séries, u n certain n o m b r e c o m p r e n n e n t e x a c t e m e n t u unions Ç A A X S AA, v unions $ A A x S Aa, s unions Ç Aa X
A A et t unions Ç A a X $ Aa. Nous avons établi qu'il y a
c;; c;
u !c,;' ci„
v ic,; ci„
s icL
t ! .d+h-w
( d + h - w ) ! r ! telles séries, après avoir posé w = u + v + s + t.
En divisant le n o m b r e total de séries p a r n ! = (d + h + r ) !, on obtient la fonction de probabilité des variables u, v, s, t et l'on p e u t écrire, après quelques simplifications,
d ! J i \
P (u, v, s, t) = u , y , (d-u-v) ! ' s ! t ! (h-s-t) ! r ! d ! h ! r !
(d-u-s) ! (h-v-t) ! ( r - d - h + w ) ! (d + h + r ) ! Cette formule s'explique de la façon suivante :
y ^ —r~ T 7 j— r r u ! v ! (d-u-v) !
façons de choisir u, v, d-u-v femmes p a r m i les d femmes de géno- type A A p o u r les unir respectivement à u h o m m e s AA, v h o m m e s A a et d-u-v h o m m e s aa ;
i l y ^ 1 ^ 1 / . — â~ r
' s ! t ! (h-s-t) !
façons de choisir s, t, h-s-t femmes p a r m i les h f e m m e s Aa p o u r
les u n i r respectivement à s h o m m e s AA, t hommes Aa et h-s-t h o m - mes aa ;
façons de former d-u-s couples Ç a a X AA, h-v-t couples Ç aa X 3* A a et r - d - h + w couples Ç a a X cj aa.
Considérons à présent les h h o m m e s de génotype Aa : v ont u n e f e m m e AA, t u n e f e m m e A a et h-v-t u n e femme aa, c o m m e le m o n t r e la figure 2. O r , c o m m e il y a h ! façons de placer h croix dans ce carré de côté h, c'est-à-dire h ! façons différentes d ' a t t r i b u e r à h h o m m e s Aa, v, t et h-v-t f e m m e s de génotypes respectifs AA, A a et aa, il f a u t encore multiplier le p r o d u i t des trois expressions (1),
(2), (3) p a r h ! et p o u r u n e raison analogue, p a r d ! et r !. Le pro- duit total divisé p a r n !, n o m b r e total des séries de couples, conduit à la forme de P (u, v, s, t) trouvée.
R e m a r q u o n s que P (u, v, s, t) est aussi la fonction de probabilité des fréquences dans u n tableau de contingence, lorsque les fréquen- ces marginales sont fixées et q u e les attributs sont indépendants.
L'identité formelle entre u n t a b l e a u de contingence et notre échi- quier des couples se constate si l'on assimile chaque couple à un ob- j e t caractérisé p a r d e u x a t t r i b u t s : le premier attribut est le géno-
type du mari, le second le g é n o t y p e de la femme. Le fait que les unions se concluent au h a s a r d e n t r a î n e l'indépendance des attri- buts ; d ' a u t r e p a r t , les fréquences marginales sont fixées : ce sont les n o m b r e s d, h, r, fréquences des génotypes au départ.
O n p e u t trouver d a n s WILKS (1947, p. 213) l'analyse de la fonc- tion de probabiHté relative a u x fréquences d ' u n tableau de contin- gence, suivie du calcul des m o m e n t s . Nous donnons c e p e n d a n t ici la suite des calculs des premiers m o m e n t s telle que nous l'avions établie a v a n t d'avoir pris connaissance des résultats de Wilks, notre r a i s o n n e m e n t et nos notations p o u v a n t paraître plus simples a u x n o n - m a t h é m a t i c i e n s .
3. — E s p é r a n c e s m a t h é m a t i q u e s d e s v a r i a b l e s u, v, s, t enfin il y a
(d-u-s) ! (h-v-t) ! ( r - d - h + w ) ! (3)
L'artifice de calcul qui est à la base de la recherche des moyen- nes et des variances relatives à la fonction de probabilité
P (u, V, s, t), consiste à écrire l'identité
( x + y+ z ) < i ( x + y+ z ) ' ^ ( x + y+ z ) - " = ( x + y + z ) " , ou, e n d é v e l o p p a n t ,
d ! ^ h I
„,i; u ! V ! (d-u-v) \ ^ s t s ! t ! (h-s-t) ! ^ ^ •
^ ^T"!rT^—i^vT- y" = ^ TT~^n—r x' y'" zP a, b a ! b ! (r-a-b) ! ^ 1 ! m ! p ! ^
E n i d e n t i f i a n t les coefficients de x' y™ ZP d a n s les d e u x m e m b r e s , on o b t i e n t
d ! h ! r !
u ! V ! (d-u-v) ! s ! t ! (h-s-t) ! a ! b ! (r-a-b) !
v + t + b = m
1 ! m ! p !
C e t t e i d e n t i t é est vraie p o u r toutes les v a l e u r s d( 1, m , p telles q u e 1 + m + p = n. E n p r e n a n t c o m m e v a l e u r s particulières de 1, m , p r e s p e c t i v e m e n t d, h, r, o n o b t i e n t
„ + s f a = d " ! v l (d-u-v) ! • s ! t ! (h-s-t) ! ' a ! b ! (r-a-b) ! =
v + t + b = h
n I d ! h ! r !
a e t b a y a n t alors n é c e s s a i r e m e n t les valeurs a = d-u-s et b = h-v-t.
Il suffit d ' é t e n d r e la s o m m e d u p r e m i e r m e m b r e à toutes les v a - leurs possibles de u, v, s, t p o u r t r o u v e r q u e P (u, v, s, t) = 1.
V o i c i c o m m e n t on calcule E (u).
E (u) = 2" u P (u, V, s, t) =
u , V , s, t
d ! d ! h ! h ! r ! r !
u, v'fs, t ! V ! (d-u-v) ! (h-s-t) ! (d-u-s) ! (h-v-t) ! ( r - d - h + w ) ! n ! I c i , on d o i t exploiter l ' i d e n t i t é
( x + y + z ) i - - ' ( x + y + z) h ( x + y + z ) ^ = ( x + y + z ) " - i
qui conduit à la nouvelle identité (dl-) ! h ! r !
u.i+sHa=i (u-1) ' V ! (d-u-v) ! s ! t ! (h-s-t) ! a ! b ! (r-a-b) ! -
v + t + b = m
(n-l) ! 1 ! m ! p !
Si l'on p r e n d respectivement p o u r 1, m et p les valeurs d - l , h , r, il f a u d r a q u e a = d-u-s et b = h-v-t et l'on o b t i e n t
(d-1) ! (d-1) ! h ! h ! r ! r ! d d
u . v . s . t ! V ! (d-u-v) ! s ! t ! (h-s-t) ! (d-u-s) ! (h-v-t) ! 1
r - d - h + w ) ! (n-1) ! n !
= 2: u P (u, v, s, t) = E (u d^
u, V , s , t n
O n établit q u e E (v) = en p a r t a n t de la m ê m e identité q u e p o u r le calcul de E (u), mais on p r e n d respectivement p o u r 1, m et p les valeurs d, h-1 et r.
d h h"
P a r raison de symétrie, E (s) = — et E (t) = — •
4. — E s p é r a n c e s m a t h é m a t i q u e s d e u^, v^, s^, t^, uv, u s , ut, v s , vt, s t O n a
E (u2) = Z u2 P (u, V, s, t) =
u , V , s , t
Z u (u-1) P (u, V, S, t) + Z u P (u, V, s, t).
I l , V , s , t u , V , s, t
Le second terme v a u t E (u), il suffit d o n c de calculer le premier.
O n p a r t de l'identité
( x+ y+ z ) " - 2 ( x+ y+ z ) h ( x+ y + z)"" = ( x+ y+ z ) " " - e t e n p o s a n t
1 = d-2, m = h, p = r, o n obtient
n (n-1) n
M o n t r o n s encore c o m m e n t on calcule E (v^) E (v2) = i ; V (v-1) P (u, V, s, t ) + E (v)
U , V , s, t
O n p a r t de la m ê m e identité
( x + y + z ) d- 2 ( x + y + z ) h ( x + y + z ) ' = ( x + y + z ) " - ^ qui, d é v e l o p p é e , d o n n e
( d- 2 ) J 2 d-u-v . y ^ ,.s jh-s-t .
u ! (v-2) ! (d-u-v) ! ^ ^ s ! t ! (h-s-t) ! ^ ^ ^
y _ _. .a ! b ! (r-a-b) \ ^ ^ - ^ 1 ! m ! p ! _ ^ (n-2) xa yb ^r-a-b ^ ( - ^ n T y"^
O n identifie les coefficients d e y'" d a n s les d e u x m e m b r e s : (d-2) ! h\ r ! ^ (n-2) !
u+s+a=i U ! (v-2) ! (d-u-v) ! • s ! t ! (h-s-t) ! " a ! b ! (r-a-b) 1 - 1 ! m 1 p !
v - 2 + t + b = m
P o u r 1 = d, m = h-2, p = r, il f a u t q u e a = d-u-s et b = h-v-t, de sorte q u e
y (d-2) ! h ! r ! ^
u, V, s, t u ! (v-2) ! (d-u-v) ! s ! t ! (h-s-t) ! (d-u-s) 1 (h-v-t) ! ( r - d - h + w ) ! "
(n-2) ! d ! (h-2) ! r ! T o u s calculs faits, o n t r o u v e
d (d-1) h (h-1)
V [v-i) r [U, V, s, i) = u, V , s, t
d h (d-1) (h-1) , d h
r V (v-i) p (u, V, s, t) = -V(i^:îj
E (v^) =
n (n-1)
E (uv), E (us), etc., s ' o b t i e n n e n t à l'aide des m ê m e s types d ' i d e n - tités d a n s lesquels o n d o n n e c h a q u e fois à 1, m , p les valeurs con- venables.
TABLEAU I
E s p é r a n c e s m a t h é m a t i q u e s (d-l)2 d"
E (u) =
—
E (u^) = — y - ^ + — n n (n-1) ndh dh(d-l) (h-1) dh E (v) = — E (v^) = - ; \ . + —
n n (n-1) n dh dh(d-l) (h-1) dh E s) = E (s^) = \ , \ + —
n n (n-1) n h» h^ (h-l)2 h»
E t =
—
E t^) = ^ + — n n (n-1) n E (uv) = E (us)E (ut) = E (vs)
E (vt) = E (st)
d^ h(d-l) n (n-1) d^ h2
n(n-l) dh^ (h-1) n (n-1)
5. — V a r i a n c e s e t c o v a r i a n c e s d e u, v, s, t
D u t a b l e a u I se d é d u i s e n t a i s é m e n t les v a r i a n c e s et les c o v a r i a n c e s rassemblées d a n s le t a b l e a u I I .
TABLEAU I I
V (u) = d2(n-d)VnHn-l)
V (v) = V(s) = dh(n-d)(n-h)/n2(n-l) V (t) = h2(n-h)Vn2(n-l)
cov (uv) = cov (us) = — d%(n-d)/n2(n-l) cov (ut) = cov (vs) = d2hVn^(n-l) cov (vt) = cov (st) = — dh2(n-h)/n2(n-l)
C o n c l u s i o n s
Les espérances m a t h é m a t i q u e s de u, v, s, t sont celles que l'on trouverait p o u r u n e distribution multinomiale, où la probabilité d ' u n e u n i o n A A X AA serait d^/n^, celle d ' u n e u n i o n A A X Aa dh/n^, etc. Mais les variances et les covariances trouvées ici ne sont pas égales à celles q u e l'on tirerait d ' u n e telle distribution multi- nomiale. R e m a r q u o n s q u e les covariances de u t et de vs sont ici positives c o n t r a i r e m e n t à ce qui se passerait d a n s u n e distribution m u l t i n o m i a l e .
Les espérances m a t h é m a t i q u e s d u t a b l e a u I p e u v e n t être utilisées p o u r calculer les espérances m a t h é m a t i q u e s , les variances et les covariances des fréquences génotypiques de la génération suivante
( D E F R I S E - G U S S E N H O V E N , 1 9 6 4 ) .
R É S U M É
Dans une population panmictique à mariage monogame permanent, on a calculé la fonction de probabilité P (u, v, s, t), les variances et les covarian- ces des fréquences u, v, s, t des unions de génotypes respectifs AA X AA, AA X Aa, Aa X AA et Aa X Aa.
SUMMARY
The probability function P (u, v, s, t), the variances and covariances of the frequencies u, v, s, t of unions of respective génotypes AA X AA, AA X Aa, Aa X AA, Aa X Aa are calculated in a monogamie panmictic population with permanent marriage.
BIBLIOGRAPHIE DALHBERG, G .
1947 Mathematical methods for population genetics.
Karger, Basel, 182 p.
DEFRISE-GUSSENHOVEN, E .
1964 Variances de fréquences géniques et génotypiques de populations panmictiques avec et sans mariage.
Acta Genêt., 14 : 3 5 1 - 3 6 5 . WiLKS, G .
1947 Mathematical statistics.
Princeton University Press, Princeton, 284 p.
Adresse de l'auteur : Mme E. DEFRISE-GUSSENHOVEN,
Centre national de Radiobiologie et de Génétique
" 31, rue Vautier, Bruxelles 4.