• Aucun résultat trouvé

DISTRIBUTION DES FRÉQUENCES DES UNIONS DE DIVERS GÉNOTYPES DANS UNE POPULATION MONOGAME À EFFECTIF LIMITÉ

N/A
N/A
Protected

Academic year: 2022

Partager "DISTRIBUTION DES FRÉQUENCES DES UNIONS DE DIVERS GÉNOTYPES DANS UNE POPULATION MONOGAME À EFFECTIF LIMITÉ"

Copied!
10
0
0

Texte intégral

(1)

DISTRIBUTION DES FRÉQUENCES DES UNIONS DE DIVERS GÉNOTYPES

DANS U N E POPULATION MONOGAME À EFFECTIF LIMITÉ

E n analysant un modèle de population monogame (DEFRISE- GussENHOVEN, 1964) nous avons été amenée à élaborer une distri­

bution de fréquences qui présente quelques analogies avec la dis­

tribution multinomiale, mais qui est un peu plus difficile à manier.

Nous voulons exposer l'élaboration et l'étude de cette distribu­

tion, d'une part pour justifier l'emploi que nous faisons ailleurs {toc. cit.) de certaines formules et d'autre part parce que le pro­

blème à propos duquel la distribution a été établie, peut se poser dans d'autres domaines que celui de la génétique des populations.

1. — D é f i n i t i o n d u m o d è l e d e p o p u l a t i o n m o n o g a m e p a n m i c t i q u e e t e x p o s é d u p r o b l è m e

Considérons un isolât — c'est­à­dire une population dont les membres s'unissent exclusivement entre eux — caractérisé par la propriété suivante : les unions se font entre sujets se choisissant au hasard, à cela près qu'ils appartiennent à la même génération ; un même nombre n d'hommes et de femmes forment ainsi n couples stables dont les enfants constitueront la génération suivante.

O n reconnaît dans ce modèle, celui qu'utilise DAHLBERG (1947) dans ses études sur la consanguinité.

Le problème qui s'est posé était de calculer, en fonction des fré­

par

E . Dé F R I S E - G U S S E N H O V E N ( B r u x e l l e s )

(2)

quences des génotypes AA, Aa, aa chez les parents, les fréquences des génotypes chez les enfants.

Supposons q u e chez les parents, il y a, d a n s c h a q u e sexe d sujets de génotype A A

h » » » A a r » » » a a avec d + h + r = n.

Représentons p a r les cases d ' u n échiquier les unions possibles d a n s u n e telle p o p u l a t i o n (fig. 1). U n côté figure les hommes, d o n t d sont de génotype AA, h de génotype Aa et r de génotype a a . L ' a u t r e côté de l'échiquier correspond a u x femmes, avec les m ê m e s fréquences génotypiques.

d A A

hommes

h Aa aa

d A A

g A a

aa r X

X

X V

X

X X

s X ( t )

X

X X X

X X

—1 X

X

fig. 1.

hommes h Aa

ai t)

B

•S

V A A [

t À a | h - V - t aa !

fig. 2.

(3)

L a figure 1 correspond au cas particulier p o u r lequel n = 15, d = 4, h = 6, r = 5.

L'ensemble des 15 croix placées dans les cases de l'échiquier re- présente l'une des façons de f o r m e r 15 unions avec ces 15 h o m m e s et ces 15 femmes et c'est de la composition génotypique particulière de ces 15 couples q u e d é p e n d r o n t n a t u r e l l e m e n t les fréquences gé- notypiques des enfants.

Si nous désignons respectivement p a r u, v, s, t le n o m b r e des unions de génotype

$ A A X cî AA, Ç A A X t? Aa, $ Aa X ^ AA, ? Aa x Aa, on a, p o u r l'exemple particulier de la figure 1, u = 3, v = 1, s = 0, t = 3.

Puisque c h a q u e sujet se m a r i e mais n ' a q u ' u n seul conjoint, u n e croix et u n e seule occupe c h a q u e ligne et c h a q u e colonne de l'échiquier, de sorte q u e les fréquences des autres types d'unions, se déduisent aisément des valeurs de u, v, s, t.

Il y a

d-u-v = 0 union $ A A X S a a

h-s-t = 3 unions Ç Aa X S a a

d-u-s = 1 union ? aa X S A A

h-v-t = 2 unions $ a a X 3 A a

r-(d-u-s)-(h-v-t) = 2 unions Ç aa X â a a Il existe n a t u r e l l e m e n t d ' a u t r e s façons de former 15 couples ou de placer 15 croix sur l'échiquier p o u r lesquelles on a u r a i t également u = 3, V = 1, s = 0, t = 3, tandis que, p o u r d ' a u t r e s séries de

15 unions, on trouverait, p o u r u, v, s, t, des valeurs différentes.

u, V, s, t, sont des variables aléatoires ; c'est la connaissance de leur espérance m a t h é m a t i q u e , de leur variance et leurs covariances qui nous p e r m e t t r a de calculer les fréquences génotypiques de la génération suivante.

2. — D i s t r i b u t i o n d e f r é q u e n c e s d e u, v, s, t

Les valeurs q u e p e u v e n t p r e n d r e les nombres u, v, s, t ne sont pas i n d é p e n d a n t e s . Ainsi, il est évident q u e u + v ne p e u t pas dépasser d. E n effet, u et v sont les fréquences de couples d a n s lesquels la f e m m e est de g é n o t y p e A A ; c o m m e il n ' y a que d femmes AA, il ne p e u t y avoir plus de d tels couples.

(4)

P o u r u n e raison analogue, u + s ^ d , s + t ^ h e t v + t < h . Nous allons établir la répartition simultanée des variables aléa- toires u, V, s, t.

Il y a 15 ! façons différentes de placer 15 croix dans l'échiquier de la figure 1 de m a n i è r e qu'il n ' y ait q u ' u n e croix p a r ligne et p a r colonne ; plus généralement, s'il y a n h o m m e s et n femmes, il y a u r a n ! séries différentes de n couples.

P a r m i ces n ! séries, u n certain n o m b r e c o m p r e n n e n t e x a c t e m e n t u unions Ç A A X S AA, v unions $ A A x S Aa, s unions Ç Aa X

A A et t unions Ç A a X $ Aa. Nous avons établi qu'il y a

c;; c;

u !

c,;' ci„

v i

c,; ci„

s i

cL

t ! .

d+h-w

( d + h - w ) ! r ! telles séries, après avoir posé w = u + v + s + t.

En divisant le n o m b r e total de séries p a r n ! = (d + h + r ) !, on obtient la fonction de probabilité des variables u, v, s, t et l'on p e u t écrire, après quelques simplifications,

d ! J i \

P (u, v, s, t) = u , y , (d-u-v) ! ' s ! t ! (h-s-t) ! r ! d ! h ! r !

(d-u-s) ! (h-v-t) ! ( r - d - h + w ) ! (d + h + r ) ! Cette formule s'explique de la façon suivante :

y ^ —r~ T 7 j— r r u ! v ! (d-u-v) !

façons de choisir u, v, d-u-v femmes p a r m i les d femmes de géno- type A A p o u r les unir respectivement à u h o m m e s AA, v h o m m e s A a et d-u-v h o m m e s aa ;

i l y ^ 1 ^ 1 / . — â~ r

' s ! t ! (h-s-t) !

façons de choisir s, t, h-s-t femmes p a r m i les h f e m m e s Aa p o u r

(5)

les u n i r respectivement à s h o m m e s AA, t hommes Aa et h-s-t h o m - mes aa ;

façons de former d-u-s couples Ç a a X AA, h-v-t couples Ç aa X 3* A a et r - d - h + w couples Ç a a X cj aa.

Considérons à présent les h h o m m e s de génotype Aa : v ont u n e f e m m e AA, t u n e f e m m e A a et h-v-t u n e femme aa, c o m m e le m o n t r e la figure 2. O r , c o m m e il y a h ! façons de placer h croix dans ce carré de côté h, c'est-à-dire h ! façons différentes d ' a t t r i b u e r à h h o m m e s Aa, v, t et h-v-t f e m m e s de génotypes respectifs AA, A a et aa, il f a u t encore multiplier le p r o d u i t des trois expressions (1),

(2), (3) p a r h ! et p o u r u n e raison analogue, p a r d ! et r !. Le pro- duit total divisé p a r n !, n o m b r e total des séries de couples, conduit à la forme de P (u, v, s, t) trouvée.

R e m a r q u o n s que P (u, v, s, t) est aussi la fonction de probabilité des fréquences dans u n tableau de contingence, lorsque les fréquen- ces marginales sont fixées et q u e les attributs sont indépendants.

L'identité formelle entre u n t a b l e a u de contingence et notre échi- quier des couples se constate si l'on assimile chaque couple à un ob- j e t caractérisé p a r d e u x a t t r i b u t s : le premier attribut est le géno-

type du mari, le second le g é n o t y p e de la femme. Le fait que les unions se concluent au h a s a r d e n t r a î n e l'indépendance des attri- buts ; d ' a u t r e p a r t , les fréquences marginales sont fixées : ce sont les n o m b r e s d, h, r, fréquences des génotypes au départ.

O n p e u t trouver d a n s WILKS (1947, p. 213) l'analyse de la fonc- tion de probabiHté relative a u x fréquences d ' u n tableau de contin- gence, suivie du calcul des m o m e n t s . Nous donnons c e p e n d a n t ici la suite des calculs des premiers m o m e n t s telle que nous l'avions établie a v a n t d'avoir pris connaissance des résultats de Wilks, notre r a i s o n n e m e n t et nos notations p o u v a n t paraître plus simples a u x n o n - m a t h é m a t i c i e n s .

3. — E s p é r a n c e s m a t h é m a t i q u e s d e s v a r i a b l e s u, v, s, t enfin il y a

(d-u-s) ! (h-v-t) ! ( r - d - h + w ) ! (3)

L'artifice de calcul qui est à la base de la recherche des moyen- nes et des variances relatives à la fonction de probabilité

P (u, V, s, t), consiste à écrire l'identité

(6)

( x + y+ z ) < i ( x + y+ z ) ' ^ ( x + y+ z ) - " = ( x + y + z ) " , ou, e n d é v e l o p p a n t ,

d ! ^ h I

„,i; u ! V ! (d-u-v) \ ^ s t s ! t ! (h-s-t) ! ^ ^ •

^ ^T"!rT^—i^vT- y" = ^ TT~^n—r x' y'" zP a, b a ! b ! (r-a-b) ! ^ 1 ! m ! p ! ^

E n i d e n t i f i a n t les coefficients de x' y™ ZP d a n s les d e u x m e m b r e s , on o b t i e n t

d ! h ! r !

u ! V ! (d-u-v) ! s ! t ! (h-s-t) ! a ! b ! (r-a-b) !

v + t + b = m

1 ! m ! p !

C e t t e i d e n t i t é est vraie p o u r toutes les v a l e u r s d( 1, m , p telles q u e 1 + m + p = n. E n p r e n a n t c o m m e v a l e u r s particulières de 1, m , p r e s p e c t i v e m e n t d, h, r, o n o b t i e n t

„ + s f a = d " ! v l (d-u-v) ! • s ! t ! (h-s-t) ! ' a ! b ! (r-a-b) ! =

v + t + b = h

n I d ! h ! r !

a e t b a y a n t alors n é c e s s a i r e m e n t les valeurs a = d-u-s et b = h-v-t.

Il suffit d ' é t e n d r e la s o m m e d u p r e m i e r m e m b r e à toutes les v a - leurs possibles de u, v, s, t p o u r t r o u v e r q u e P (u, v, s, t) = 1.

V o i c i c o m m e n t on calcule E (u).

E (u) = 2" u P (u, V, s, t) =

u , V , s, t

d ! d ! h ! h ! r ! r !

u, v'fs, t ! V ! (d-u-v) ! (h-s-t) ! (d-u-s) ! (h-v-t) ! ( r - d - h + w ) ! n ! I c i , on d o i t exploiter l ' i d e n t i t é

( x + y + z ) i - - ' ( x + y + z) h ( x + y + z ) ^ = ( x + y + z ) " - i

(7)

qui conduit à la nouvelle identité (dl-) ! h ! r !

u.i+sHa=i (u-1) ' V ! (d-u-v) ! s ! t ! (h-s-t) ! a ! b ! (r-a-b) ! -

v + t + b = m

(n-l) ! 1 ! m ! p !

Si l'on p r e n d respectivement p o u r 1, m et p les valeurs d - l , h , r, il f a u d r a q u e a = d-u-s et b = h-v-t et l'on o b t i e n t

(d-1) ! (d-1) ! h ! h ! r ! r ! d d

u . v . s . t ! V ! (d-u-v) ! s ! t ! (h-s-t) ! (d-u-s) ! (h-v-t) ! 1

r - d - h + w ) ! (n-1) ! n !

= 2: u P (u, v, s, t) = E (u d^

u, V , s , t n

O n établit q u e E (v) = en p a r t a n t de la m ê m e identité q u e p o u r le calcul de E (u), mais on p r e n d respectivement p o u r 1, m et p les valeurs d, h-1 et r.

d h h"

P a r raison de symétrie, E (s) = — et E (t) = — •

4. — E s p é r a n c e s m a t h é m a t i q u e s d e u^, v^, s^, t^, uv, u s , ut, v s , vt, s t O n a

E (u2) = Z u2 P (u, V, s, t) =

u , V , s , t

Z u (u-1) P (u, V, S, t) + Z u P (u, V, s, t).

I l , V , s , t u , V , s, t

Le second terme v a u t E (u), il suffit d o n c de calculer le premier.

O n p a r t de l'identité

( x+ y+ z ) " - 2 ( x+ y+ z ) h ( x+ y + z)"" = ( x+ y+ z ) " " - e t e n p o s a n t

1 = d-2, m = h, p = r, o n obtient

n (n-1) n

(8)

M o n t r o n s encore c o m m e n t on calcule E (v^) E (v2) = i ; V (v-1) P (u, V, s, t ) + E (v)

U , V , s, t

O n p a r t de la m ê m e identité

( x + y + z ) d- 2 ( x + y + z ) h ( x + y + z ) ' = ( x + y + z ) " - ^ qui, d é v e l o p p é e , d o n n e

( d- 2 ) J 2 d-u-v . y ^ ,.s jh-s-t .

u ! (v-2) ! (d-u-v) ! ^ ^ s ! t ! (h-s-t) ! ^ ^ ^

y _ _. .a ! b ! (r-a-b) \ ^ ^ - ^ 1 ! m ! p ! _ ^ (n-2) xa yb ^r-a-b ^ ( - ^ n T y"^

O n identifie les coefficients d e y'" d a n s les d e u x m e m b r e s : (d-2) ! h\ r ! ^ (n-2) !

u+s+a=i U ! (v-2) ! (d-u-v) ! • s ! t ! (h-s-t) ! " a ! b ! (r-a-b) 1 - 1 ! m 1 p !

v - 2 + t + b = m

P o u r 1 = d, m = h-2, p = r, il f a u t q u e a = d-u-s et b = h-v-t, de sorte q u e

y (d-2) ! h ! r ! ^

u, V, s, t u ! (v-2) ! (d-u-v) ! s ! t ! (h-s-t) ! (d-u-s) 1 (h-v-t) ! ( r - d - h + w ) ! "

(n-2) ! d ! (h-2) ! r ! T o u s calculs faits, o n t r o u v e

d (d-1) h (h-1)

V [v-i) r [U, V, s, i) = u, V , s, t

d h (d-1) (h-1) , d h

r V (v-i) p (u, V, s, t) = -V(i^:îj

E (v^) =

n (n-1)

E (uv), E (us), etc., s ' o b t i e n n e n t à l'aide des m ê m e s types d ' i d e n - tités d a n s lesquels o n d o n n e c h a q u e fois à 1, m , p les valeurs con- venables.

(9)

TABLEAU I

E s p é r a n c e s m a t h é m a t i q u e s (d-l)2 d"

E (u) =

E (u^) = — y - ^ + — n n (n-1) n

dh dh(d-l) (h-1) dh E (v) = — E (v^) = - ; \ . + —

n n (n-1) n dh dh(d-l) (h-1) dh E s) = E (s^) = \ , \ + —

n n (n-1) n h» h^ (h-l)2 h»

E t =

E t^) = ^ + — n n (n-1) n E (uv) = E (us)

E (ut) = E (vs)

E (vt) = E (st)

d^ h(d-l) n (n-1) d^ h2

n(n-l) dh^ (h-1) n (n-1)

5. — V a r i a n c e s e t c o v a r i a n c e s d e u, v, s, t

D u t a b l e a u I se d é d u i s e n t a i s é m e n t les v a r i a n c e s et les c o v a r i a n c e s rassemblées d a n s le t a b l e a u I I .

TABLEAU I I

V (u) = d2(n-d)VnHn-l)

V (v) = V(s) = dh(n-d)(n-h)/n2(n-l) V (t) = h2(n-h)Vn2(n-l)

cov (uv) = cov (us) = — d%(n-d)/n2(n-l) cov (ut) = cov (vs) = d2hVn^(n-l) cov (vt) = cov (st) = — dh2(n-h)/n2(n-l)

(10)

C o n c l u s i o n s

Les espérances m a t h é m a t i q u e s de u, v, s, t sont celles que l'on trouverait p o u r u n e distribution multinomiale, où la probabilité d ' u n e u n i o n A A X AA serait d^/n^, celle d ' u n e u n i o n A A X Aa dh/n^, etc. Mais les variances et les covariances trouvées ici ne sont pas égales à celles q u e l'on tirerait d ' u n e telle distribution multi- nomiale. R e m a r q u o n s q u e les covariances de u t et de vs sont ici positives c o n t r a i r e m e n t à ce qui se passerait d a n s u n e distribution m u l t i n o m i a l e .

Les espérances m a t h é m a t i q u e s d u t a b l e a u I p e u v e n t être utilisées p o u r calculer les espérances m a t h é m a t i q u e s , les variances et les covariances des fréquences génotypiques de la génération suivante

( D E F R I S E - G U S S E N H O V E N , 1 9 6 4 ) .

R É S U M É

Dans une population panmictique à mariage monogame permanent, on a calculé la fonction de probabilité P (u, v, s, t), les variances et les covarian- ces des fréquences u, v, s, t des unions de génotypes respectifs AA X AA, AA X Aa, Aa X AA et Aa X Aa.

SUMMARY

The probability function P (u, v, s, t), the variances and covariances of the frequencies u, v, s, t of unions of respective génotypes AA X AA, AA X Aa, Aa X AA, Aa X Aa are calculated in a monogamie panmictic population with permanent marriage.

BIBLIOGRAPHIE DALHBERG, G .

1947 Mathematical methods for population genetics.

Karger, Basel, 182 p.

DEFRISE-GUSSENHOVEN, E .

1964 Variances de fréquences géniques et génotypiques de populations panmictiques avec et sans mariage.

Acta Genêt., 14 : 3 5 1 - 3 6 5 . WiLKS, G .

1947 Mathematical statistics.

Princeton University Press, Princeton, 284 p.

Adresse de l'auteur : Mme E. DEFRISE-GUSSENHOVEN,

Centre national de Radiobiologie et de Génétique

" 31, rue Vautier, Bruxelles 4.

Références

Documents relatifs

[r]

 La droite passant par le sommet A et coupant le secteur angulaire saillant · BAC en deux angles de même mesure s’appelle la bissectrice intérieure issue de A

Les féveroles (vicia Faba) en tant que source protéique alternative dans les rations pour poulets de chair. Leffet de divers

Pour v´ erifier son hypoth` ese, Mendel croise un grand nombre de haricots pour lesquels deux caract` eres, couleur et aspect, sont d´ etermin´ es chacun par deux all` eles : C

Complete the sentences using the present simple or the present continuous (Complète les phrases ci-dessous en utilisant le présent simple ou le présent continu).. (play) tennis

Complete the sentences using the present simple or the present continuous (Complète les phrases ci-dessous en utilisant le présent simple ou le présent continu)g. (play) tennis

[r]

[r]