CALCUL A PRIORI, INTRA- ET INTER-POPULATIONS,
DES VARIANCES ET COVARIANCES GÉNOTYPIQUES
ENTRE APPARENTÉS QUELCONQUES
C. CHEVALET Laboratoire de Génétique cellulaire, Centre de Recherches de Toulouse, I. N. R. A.,
’ 31 - Castanet-Tolosan
RÉSUMÉ
La distinction, dans une population d’effectif limité, entre les espérances mathématiques prises par rapport à la distribution des fréquences alléliques, et par rapport à la distribution des structures d’identité et de non-identité possibles ; l’interprétation des coefficients d’identité
au niveau d’une population unique ; l’hypothèse qu’un caractère quantitatif est gouverné par
un grand nombre de gènes indépendants ayant des contributions homogènes, aboutissent à des formules nouvelles de variances et de covariances génotypiques entre apparentés quelconques.
Alors que les formules de GILLOIS ne s’appliquent que si l’on dispose d’un grand nombre
de réplications du même pedigree, ce qui est rare dans la pratique, les nouvelles expressions sont
valables pour tout couple d’individus consanguins et apparentés au sein d’une population unique,
et peuvent donc déboucher sur des applications en amélioration des plantes et en génétique
animale.
INTRODUCTION
La forme
théorique
des variances et covariances entre des individusapparentés
a évolué lentement
depuis
lespremiers
travaux de FiSHER et de WRIGHT. FISHER(igi8)
a calculé les corrélations pour desparentés simples ;
dans le casd’additivité,
W RI G H
T
(ig2i-i 9 22)
les a étendues avecl’usage
du « coefficient ofinbreeding
» etde la théorie des «
path-coefficients
». MA!,!coT( 194 6- 194 8)
a introduit les notionsprobabilistes
dans cedomaine,
en définissant les coefficients deconsanguinité
etde
parenté.
De nombreux auteurs ont peu à peugénéralisé
les résultats de MALÉCOTaux cas de caractères
gouvernés
parplusieurs loci,
avecepistasis
etlinkage,
maistoujours
en excluant laconsanguinité.
GILLOIS( 19 6 4 , 19 65, 19 66
a,b)
a introduit larelation d’identité entre les
gènes,
les situations et les coefficients d’identité etrésolu le
problème
dans le cas d’un caractère avecdominance, gouverné
par un ouplusieurs
lociindépendants
dans unepopulation diploïde
et pour desdegrés quel-
conques de
parenté
et deconsanguinité.
HARRIS( 19 6 4 )
a obtenu le même résultat par une méthodequi s’apparente plus
aux travaux de KEMPTHORNE( 1954 )
et deT
RUSTRUM
(ig6o).
A la suite deG ILLOIS ,
BOUFFETTE( 19 66)
a étendu le résultataux
espèces tétraploïdes ; G ALLAIS ( 1970 )
au cas d’un caractèregouverné
parplu-
sieurs loci
épistatiques
et soumis aulinkage,
dans unepopulation diploïde.
Cesderniers travaux traitent
toujours
d’ungrand
nombre depopulations analogues,
ilsne
permettent
pas l’étude d’unepopulation unique
et réelle.En
reprenant
les calculs deG ILLOIS ,
et enexploitant
lespropriétés
des coeffi- cients d’identité nous obtenons de nouvelles formulesqui,
sous deshypothèses qui
seront
précisées,
concernent unepopulation particulière.
I. - LE
MODÈLE
ET LESHYPOTHÈSES GÉNÉTIQUES
DU CALCULo
A. - Le modèle
mathématique
Le caractère
quantitatif
estgouverné
par un ensemble de lociindépendants.
Chaque
locus(noté a )
a une contributionZa, qui
estdécomposée
en :où X&dquo; et X’a sont les contributions additives des
gènes,
Dale résidu de dominance.Ces
quantités
sont définies comme chez FISCHER dans unepopulation panmictique
où tous les individus sont
indépendants,
sansparenté
niconsanguinité.
Comme chez
G ILLOIS ,
nous noterons avecl’indice ! (Ep)
lesespérances
mathé-matiques prises
dans ces conditionsd’indépendance. I,’indice supérieur (q) précisera qu’il s’agit
d’uneespérance prise
parrapport
à la distribution desfréquences
allé-liques
dans unepopulation
donnée. Par convention les variables aléatoires sont centrées dans unepopulation panmictique
infinie enéquilibre.
B. - Les lois
conjointes
des variables aléatoiresgénoty!iques
Dans une
population infinie,
enéquilibre panmictique,
la loi d’une variable aléatoiregénotypique
Za est définie par la connaissance desprobabilités (q&dquo;)
desclasses d’isoaction
(A,) (allèles)
au locus(a),
et la loi deHardy-Weinberg :
chacundes
gènes présents
au locus(a)
a,indépendamment
des autres, laprobabilité q,’
d’être l’allèle
A&dquo;,
Dans une
population
où deuxgènes
distinctspeuvent
êtreidentiques
par des- cendance mendélienne(sans mutation),
la loi deHardy-Weinberg
nepermet plus
de déterminer les
fréquences
desgénotypes d’après
lesfréquences alléliques. L’hypo-
thèse faite par
G ILLOI S, généralisant Mn!,!coT,
est que la distributionconjointe
desgénotypes
deplusieurs
individus est définie si l’on connaît d’unepart
la distribution desfréquences alléliques
dans lapopulation,
et d’autrepart
la situation d’identité réalisée entre lesgènes
de ces individus.Alors
chaque
groupe degènes identiques
aindépendamment
des autres groupes,la
probabilité q!
d’être formé d’allèlesA;.
Ainsi par
exemple,
siquatre gènes G i , G!, G s
etG 4
d’un locus où il y a deux classes d’isoactionA i
etA z ,
defréquences respectives
qi et q2 = i - qi dans lapopulation,
sont dans la situation d’identitéS. :
. - - - .. - .
les
génotypes possibles
sont :Cela suppose que l’on fait
l’hypothèse,
vérifiée dans unepopulation
«isoga- mique
»(Mnr,!coT, i 939 ),
del’équivalence
entre l’identité et ladépendance
strictedes
gènes
isoactifs. Cette restriction a été levée par GILLOIS( 19 66
c,19 6 7
a,b)
avecles notions de
contrainte,
de loisjointes,
et degénotypes généralisés.
Les situationsd’identité et
l’hypothèse d’équivalence
entre non-identité etindépendance
définissentune classe
particulière
de loisjointes,
que nous avons retenue dans le modèle.C. - Les variables aléatoires indicatrices de situation d’identité et les
coefficients
d’identitéUn
couple
d’individusdiploïdes,
1 etJ,
étantdonné,
dans unepopulation parti- culière,
et un locus(oc)
étantdésigné,
une seule desquinze
situations d’identité pos- sibles entre lesquatre gènes
estréalisée,
mais est inconnue. Connaissant lagénéalogie
de la
population,
onpeut
définir laprobabilité qu’une
situation Ssoit
réalisée :c’est le coefficient d’identité 8 associé à la situation S x dans une
généalogie.
Ence sens un coefficient d’identité est un attribut de la
généalogie
et non d’une popu- lationparticulière ;
ilpeut s’interpréter
comme la limite de lafréquence
aveclaquelle
une situation d’identité
apparaît
dans l’ensemble de Npopulations,
Mi, <Ù2’&dquo;’’ <Ùn,possédant
la mêmegénéalogie, quand
N croît indéfiniment.Pour caractériser l’état d’une
population particulière ( w)
décrite par la relation d’identité nous introduisons des indicateurs de situation d’identité : uncouple (I, J),
et un locus
(oc)
étantdésignés,
on définit les indicateursAi( m)
par :Ok(w)
= i si lesgènes (a)
ducouple (I, J)
sont, dans lapopulation (w),
ensituation S x.
Et
Si la
généalogie
estfixée,
et si l’on considère toutes lespopulations (Cù)
vérifiantcette
généalogie,
lesquantités Ok(w)
sont les réalisationsd’une
variablealéatoire,
définie sur
l’espace
de toutes les structures d’identitécompatibles
avec lagénéalogie.
La loi de cette variable aléatoire est définie par les coefficients d’identité 8x :
On
peut
écrire que le coefficient 8x estl’espérance, prise
parrapport
àl’espace
des réalisations
( m) possibles
de toutevariable A! :
8 x =E&dquo; (A §( m) ) quel
que soit ce et que8
est une limite defréquence :
pour N réalisations Mi, <.ù2, ..., coN de la
généalogie.
Mais une autre
interprétation
des coefficients d’identitépeut
êtredonnée,
au niveau d’unepopulation particulière (w).
Si oei, OC2, .... «L sont L lociségrégeant indépendamment
les uns des autres, les variables indicatrices!!’, AK ’2@
...,AIL
sontindépendantes
etéquidistribuées.
Les réalisations
Ok’(w), !!2( <.ù),
...,@ A’L(co)
dans unepopulation particulière (o) représentent
alors L réalisations d’une même variablealéatoire, !k( <.ù),
définie surl’espace
de tous les lociindépendants imaginables,
et de loi :et 8x
peut s’interpréter
commel’espérance
desA k (m)
parrapport
àl’espace
des lociindépendants (a) :
et comme limite de
fréquence :
pour L loci IX&dquo; «2, -i,
indépendants.
L’usage
des coefficients d’identité dans leurpremière interprétation
conduit àdes
expressions qui
sontcaractéristiques
de lagénéalogie,
ets’interprètent
statisti-quement
comme des moyennes sur ungrand
nombre depopulations
vérifiant cettegénéalogie :
telles sont les formules de GILLOIS. La secondeinterprétation
nousconduit,
dans certainesconditions,
à desexpressions caractéristiques
d’une popu- lationparticulière (c,».
D. -
Propriétés
des variables aléatoires indicatrices de situation d’identité Il résulte immédiatement des définitions que :et que :
On définit de même les variables
F!( <.ù),
indicatrices de l’identité desgènes
dulocus a, dans l’individu
I,
pour lapopulation (w).
Comme entre
probabilités
on a les relations :D’où il résulte la formule du
produit :
On posera
aussi,
paranalogie
avec la relation entre le coefficient deparenté
cpi
J du
couple (I, J)
et les coefficients d’identité :II. -
L’EXPRESSION
DES VARIANCES ET COVARIANCESGÉNOTYPIQUES THÉORIQUES
DANS UNE POPULATION
PARTICULIERE
Soit
(I, J)
uncouple
d’individus dans unepopulation particulière (<.ù).
En chacundes loci
(oc) qui
contribuent au caractèreétudié,
lesgènes
ducouple
sont dans unesituation d’identité
S&dquo;’( <.ù).
Pourhomogénéiser
les notationschaque
locus(a)
estdécrit par l’ensemble des
quinze
indicatrices de situation d’identitéLes
espérances mathématiques
sontprises
parrapport
à la distribution desfréquences alléliques (q),
et sont conditionnées par la réalisationparticulière (w)
dela
généalogie.
A. -
L’ex!ression générale de
la covariancethéorique
entreapparentés
Soit Z la variable aléatoire
génotypique
totale :Les loci étant
indépendants,
la covariance entre ZI et ZJ est la somme des covariances entre les variablesZ et Z J.
Il suffit de calculer cettecovariance,
condi- tionnée par la réalisation( w),
au locus(a) :
Or on a :
où l’indice
(c) exprime
quel’espérance
estprise
sous la condition d’identité desgènes ; Eq est l’espérance
conditionnée par la réalisation de la situation S k entre Iet J
au locusconsidéré ;
une seule desquinze quantités Ok(w)
est non nulle etégale
à i.Les
expressions
desE2 sont
données par GILLOIS( 19 6 4 .
p. 72 ou1965,
p. 61corrigé
par19 66-b).
Donc :
Compte
tenu de la relation(i)
et desexpressions
desEq @
cette covariance s’écrit :expression qui
faitapparaître
pour le locus(oc) :
- la variance
génétique
additive2E q (X«) 2
= Var(Vu)
en notant Ya =2 Xcx ;
- la variance
génétique
de dominanceclassique E&dquo;«D«)2)
=Varp(D«) ;
- la variance
génétique
de dominance dans la condition d’identité :!c((D&dquo;)2)
-(!q(D&dquo;))2 = Varc(Dcx) ;
- l’interaction entre les effets additifs et de
dominance,
dans la condition d’identité :La covariance entre ZI et ZJ est alors
simplement :
B. - Valeurs
approchées
desespérances, variances,
et covariances
génotypiques
dans unepopulation
- 1
Les
expressions précédentes dépendent
de la réalisation(w),
de la structured’identité
(w) qui
est inconnue.Mais,
dans les conditionsqui
sontprécisées
au para-graphe suivant,
chacune des sommes telles que :peut
êtreapprochée
par sonespérance
Ew :qui
est unequantité indépendante de ( 6 )).
On
peut
alorsécrire, quelle
que soit la réalisation(6)) :
et de même pour la variance :
où Var
(Y), Var,. (D),
Varc(D)
et Covc(XD)
sont les sommes desquantités analogues
relatives aux différents loci
(a).
On aura
aussi,
dans les mêmes conditions :C. - Les conditions et la valeur de
l’approximation
Chacune des
quantités
Covq’&dquo;(Z,Zî)
s’écrit aussi :et est la somme de
quatre
termes dont chacun est leproduit
d’une variable indi- catrice d’une réunion de situationsd’identité,
et d’unecomposante
de la variabilité due au locus(oc).
Un terme telpeut
s’écrire :(par exemple : F!(M)
=O 9 (w) !-- 0&dquo; 2 (w)
etC2
= var(Y&dquo;)
!-- varp(D&dquo;) )
en fonction de cette écriture la covariance totale devient :
Chaque
somme en(a)
est une somme de I, variables aléatoiresindépendantes.
Nousfaisons les
hypothèses génétiques
suivantes.H- 1
. Le caractère
étudié, Z,
estgouverné par
ungrand
nombre(L)
de lociindépendants.
H- 2
. Chacune des
quantités Ci
est bornéepar
unequantité
(1.i,indépendante de
a.Cette
hypothèse
consiste seulement à dire que les contributions des loci sontbornées,
elle n’exclut pas le cas des
gènes majeurs.
H- 3
.
Chacune desquantités Ci
estsupérieure
en valeurabsolue,
à un nombrefixe
x/.Cela
signifie qu’on exclut,
dansl’analyse
de la variabilité deZ,
tous lesgènes quasi-
ment
fixés,
c’est-à-dire tous les allèles dont lafréquence
dans lapopulation
est trèsproche
de o ou de z.On notera pi =
!.t/aa, et
p = sup pi iLa
présence
degènes majeurs
se traduit par une valeurimportante
de p,qui
affectela
précision
desapproximations.
Dans ces conditions le théorème de
Liapounov s’applique
aux sommes d’aléatoiresindépendantes, qui
s’écrivent :où y, est la somme des
probabilités
des situations d’identitéindiquées
parh t (m)
(par exemple
y, =3 9
+( 12 ) ;
etoù e,
est une variable aléatoire dont la loi est voisine d’une loinormale, qui
estcentrée,
et dontl’écart-type
est :où r!
est un « coefficient dedispersion
» desC i &dquo;
vérifiant :La vérification des
hypothèses
du théorème deI,iapounov
et la démonstration de cette dernièreinégalité
sontprésentées
en annexe.Moment du
premier
ordre.Dans la somme de la formule
( 4 ),
il fautdistinguer
trois sommespartielles :
L =
I&dquo;
!-I, 2
-! Ls. EnL i
loci les contributions sontnulles ;
en Lo loci les contri- butions sontpositives ;
en I,3loci elles sontnégatives. Notons r’ p et r2 les
coefficients dedispersion
des sommespositives
etnégatives, respectivement. Alors,
O
ll E. et essont deux variables aléatoires
indépendantes proches
de la loi normaleN(o, i).
Variance.
où e est une variable aléatoire dont la loi
s’approche, quand
I, estgrand,
de la loinormale réduite
N(o,i).
Covariance.
Dans
l’expression
de la covariance interviennentquatre
oticinq ( 1 )
aléatoiressi corrélées du fait que dans
l’expression
decov ql -
(Z!Z!)
un seul des
quatre
termespeut
être non nul.( 1
) Les composantes c§ peuvent être positives ou négatives, alors que les autres (i 0 3) sont posi-
tives : on distingue deux classes de loci (L = L, + L5) où les composantes sont respectivement toutes positives ou toutes négatives. Le terme aléatoire comprend donc deux termes, l’un en
/ — ,
l’autre1 l( L.
e
n vI:: .
Notant Ci
= ! Ct
ilvient,
pour le ile-e terme( 1 ) :
«
si est
proche
d’une variable normaleN(o, r).
Soient :
La somme des termes
aléatoires, qui
est une variablealéatoire, asymptotiquement normale, centrée,
estmajorée
en valeur absolue :En élevant les deux membres au carré et en
prenant
lesespérances !!, l’inégalité
demeure. En
majorant
le second membre parapplication
del’inégalité
deSchwarz,
ilvient, quelles
que soient les corrélations entre les si :et comme les et sont
proches
de la loiN(o, i)
et que e est centrée :e
désignant
une variableproche
deN(o,i)
et a admettant lamajoration précédente,
la formule de covariance s’écrit alors :
III. -
ESPÉRANCES,
VARIANCES ET COVARIANCESGÉNOTYPIQUES
« INTER-POPUI<ATIONS )’ : FORMULES DE GILLOIS
Dans cette troisième
partie
nous retrouverons, avec les notationsintroduites,
les formulesoriginales
deG ILLOIS ,
pour les comparer auxexpressions approchées
des covariances «
intra-population
o que nous avons établies dans la secondepartie
et
préciser
lasignification
de chacun des deux groupes de formules.Les formules de GU,LOISsont obtenues
quand
onprend
simultanément lesespé-
rances
mathématiques
parrapport
à la distribution(q)
des allèles et parrapport
àla distribution de toutes les structures d’identité
(m) compatibles
avec unegénéalo- gie.
Celapeut s’écrire,
pour la covariance :et
chaque espérance
EWqpeut
sedécomposer
parrapport
aux différentes condi- tions(w).
Il vient ainsi :
La
première ligne
faitapparaître l’espérance (E W )
de la covariance conditionnée par(tù), qui
n’est autre que le second membre del’équation ( 2 ).
La deuxième
ligne
faitapparaître
lacovariance,
parrapport
à la distribution des( ce),
desespérances
conditionnées des aléatoiresgénotypiques
ZI et ZJ.On a d’une
part ; d’après
lesexpressions
établies en II-A : -dont
l’espérance !!, d’après
la formule(i)
etl’indépendance
desloci,
est :On a d’autre
part :
Il en résulte que la deuxième
ligne
a pour valeur :Et les formules «
inter-populations
n deGm,r,ors
s’écrivent :L, identité avec les formules données par GILLOIS
( 19 66
a ou19 66 b)
est immédiate : il suffit dans les formules(6)
et( 7 )
dedécomposer
Varc(D)
enpour faire
apparaître
les termes8 1 E c (D 2 ) ,
et :(8 8 - fifj) (Ec (D))
Les autres termes sontidentiques.
CONCLUSION
La distinction entre
espérances mathématiques prises
parrapport
à la distri- bution desfréquences alléliques
dans unepopulation
et parrapport
à la distribution des structuresgénétiques compatibles
avec laségrégation
mendélienne dans unepopulation
d’effectif limité ouvre de nouvellespossibilités
de calcul des corrélationsgénétiques
entreapparentés.
Elle nous apermis d’exploiter
lespropriétés
des coeffi- cients d’identité au niveau d’unepopulation,
et pas seulement au niveau d’ungrand
nombre de
populations présentant
le mêmepedigree
comme l’avait fait GILLOIS. Nous avons conservé leshypothèses
fondamentales du calcul deG ILLOIS ,
c’est- à-direprincipalement
celle del’équivalence
entre la non identité desgènes
et leurindépendance stochastique. L’introduction
de loisjointes plus générales,
et compa- tibles avec desphénomènes
de sélection seraitpossible
mais il ne semble pas que leur théorie soit encore assezdéveloppée
à cejour.
Ne faisant aucune
hypothèse
sur le nombre de lociimpliqués
dansl’expression
d’un
caractère,
ni sur lagrandeur
relative de leurscontributions,
GILLOIS( 19 6 4 )
et BOUFFETTE
( 19 66)
dans le casd’indépendance,
GAULAIS( 1970 )
dans le cas de lin-kage
nepeuvent
introduire les coefficients d’identitéqu’en prenant
desespérances
par
rapport
à toutes les structures d’identitécompatibles
avec lagénéalogie.
Lesformules qui
en résultent sontcaractéristiques
de lagénéalogie,
elles nepeuvent s’interpréter statistiquement qu’au
niveau d’un certain nombre depopulations
issues d’une même
population d’origine, respectant
la mêmegénéalogie
etayant
connu des évolutions
indépendantes.
Enrevanche,
elles sont valables pour un carac- tère déterminé par un nombrequelconque
degènes,
dont certainspeuvent
avoir des effets trèsgrands.
Mais elles ne sont pasapplicables
à laplupart
des situationszootechniques :
la construction depopulations analogues
etindépendantes
n’estpas
économiquement possible,
d’unepart.
La structure despopulations
très consan-guines
comme celles desélevages
avicoles ne fournit pas, d’autrepart,
de famillesindépendantes
ni même non corrélées comme lesupposent
les modèlesclassiques
de la
génétique quantitative : après quinze
années de sélection en effectiflimité,
le coefficient deparenté
entre individus «non-apparentés » (de pères différents)
y atteint 20 p. 100 à 30 p. 100.
Les nouvelles formules
approchées
que nous avons établies sont au contraireapplicables
à unepopulation particulière, unique, qui
vérifie unegénéalogie.
Ellesexpriment
en effet que, dans certainesconditions,
desespérances
conditionnées parune structure inconnue sont
quasiment indépendantes
de cette structure. Ces condi- tions se ramènent à deuxpoints, qui
sedégagent
des formules duparagraphe
II-c :io le nombre des loci est
grand ;
2 ! le
rapport
de laplus grande
contribution à lavariabilité,
à laplus petite
contribution non nulle est
petit
devant le nombre desloci ;
cequi exprime qu’aucun gène majeur
n’intervient dans la variabilité du caractère. Ce sont en réalité deshypothèses classiques
enGénétique quantitative, qui expliquent
notamment lesdistributions sensiblement
gaussiennes
de caractèresquantitatifs
héritables.Conjointement
avec une méthode de calculautomatique
des coefficients d’iden- tité(CHEVALET, 1971 ),
ces formules ouvrent lapossibilité d’applications
à des popu- lationsvégétales
et surtout animales où lesréplications
depopulations identiques
sont ou bien fastidieuses
(drosophiles)
ousimplement impossibles (animaux
domes-tiques)
pour des raisonséconomiques.
Dans le cas des formules deG ILLOIS ,
l’estima- tion desparamètres génétiques
était rendueimpossible
pour cetteraison ;
avec les nouvelles formules la difficulté est d’établir des estimateurs àpartir
d’un ensemble d’observationsqui
sont liées et dont les corrélationss’expriment
avec lesparamètres
à estimer. Ce n’est pas une situation
classique
enstatistique,
mais il estpossible
de définir des conditions sur les
pedigrees qui permettent
ces estimations.Reçu pour pubtication en août 1971.
SUMMARY
.4 PRIORI INTRA- AND INT!RPOPUI,ATIONS CAI,CULUS OF GENOTYPIC VARIANCES AND COVARIANCES BETWEEN INBRED RELATIVES
Through the distinction, in a limited population, between the expectations taken with respect to the distribution of allelic frequencies, and with respect to the distribution of all pos- sible identity situations ; through the meaning of identity-coefficients in a single population ;
and through classical hypotheses in population genetics, new formulae of genotypic variance
and covariance between inbred relatives are derived. When GILLOIS’S formulae only apply if
many replications of the same pedigree are given, and hence very rarely in actual situations, these new expressions hold between two inbred relatives within a single population, and then
allow applications in plant or animal breeding.
RÉFÉRENCES BIBLIOGRAPHIQUES
BOUFFETTE J., 1966. Expression de la covariance génotypique chez les tétraploïdes. Thèse 3e cycle, Fac. Sciences, Lyon.
CHEVALET C., ig7r. Calcul automatique des coefficients d’identité. Ann. Génét. Sél. anim. 3, 449-462.
F
ISHER R. A., 1918. The correlations between relatives on the supposition of mendelian inheritance.
Trans. Roy. Soc. Edinburgh, 52, 399-433.
GALLAIS A., 1970. Covariances entre apparentés quelconques avec linkage et épistasie. I. Expression générale. Ann. Génét. Sél. anim., 2, 281-310.
G
ILLOIS M., 1964. La relation d’identité en génétique. Thèse, Fac. Sciences, Paris, 294 p.
GiLLOis M., 1965. Relation d’identité en génétique. Ann. Inst. Henri-Poincaré, B, 2, i-94. G
ILLOIS M., 1966 (a). Le concept d’identité et son importance en génétique. Ann. Gén., 9, 58-65.
G
ILLOIS M., 1966 (b). Note sur la variance et la covariance génotypiques entre apparentés. Ann.
Inst. Henri-Poincaré, B, 2, 349-532.
G
ILLOIS M., 1966 (c). La relation de dépendance en génétique. Ann. Inst. Henri-Poincaré, B, 2, 261- 278.
GIL LOI
S M., 1967 (a). La notion de génotype. Ann. Gén., 10, 201-202.
G
ILLOIS M., 1967 (b). Les lois conjointes des variables aléatoires génétiques. Ann. Gén., 10, 203-206.
H
ARRIS D. L., 1964. Genotypic covariances between inbred relatives. Genetics, 50, 1320-1348.
K E
mrrxoRrrE O., xg54. The correlations between relatives in a random mating population. Proc.
Roy. Soc., B, 143, 103-113.
M
ALECOT G., x939. Théorie mathématique de l’hérédité mendélienne généralisée. Thèse, Fac. Sciences, Paris. - Republiée dans : MALECOT G., x966. Probabilité et hérédité. I. N. E. D., cahier n° 47, P. U. F.
M
ALECOT G., 1946. La consanguinité dans une population limitée. C. R. Acad. Sci. Paris, 222, 841- 843.
M AL É
COT G., 1948. Les mathématiques de l’hérédité. Masson et Cle, Paris, i vol., 60 p.
T
RUSTRUM G. B., 1960. The correlations between relatives in a random mating diploid population.
Proc. Cambo. Phil. Soc., 57, 315-320. W
RIGHT S., 1921. Systems of mating. Genetics, 6, Il,-178.
W
RIGHT S., 1922. Coefficients of inbreeding and relationships. Amer. Nat., 56, 330-338.
J
ANNEXE
I. - Les
hypothèses
du théorème deLia!ounov
Chacune des sommes de la forme :
est du
type
où les U&dquo; sont des aléatoires
indépendantes (hypothèse H-i)
de lois :D’après l’hypothèse H- 2 ,
les U« sont bornées dans leur ensemble par un nombre p.D’après H- 3 ,
la variance de Ua est uniformément minorée :et par
conséquent :
Il en
résulte, d’après
un énoncé élémentaire du théorème deI,iapounov,
que laloi de :
tend vers la loi normale réduite
N(o, i) quand
I, tend vers l’infini.La somme Wr,
peut
alors s’écrire :Le terme d’erreur relative est une aléatoire
ayant
une loiproche
de la loi normale si L estgrand (H-i),
etd’écart-type :
II. - La
majoration
ducoefficient
dedispersion
r2(principe
de ladémonst y ation).
r
2 est une fonction des
quantités Ca,
que l’on supposera être toutes du mêmesigne, positif
parexemple.
En
posant :
On a:
On cherche les extrema de r2
quand
les Cotpeuvent
varier dans un intervalle(À, IL) :
&dquo;et on suppose que chacune des valeurs extrêmes X et y est atteinte au moins une
fois.
On démontre alors que
si q ( 2 :( q :( quantités
C« sont fixées aux bornesde
l’intervalle,
la fonction r2 deL - q variables
admet un seul extremum dansl’hyper-
cube ouvert
JÀ,
!t[!q
et c’est un minimum. Le maximum de cette fonction r’, définie surl’hypercube fermé,
est donc atteint à la surface de cethypercube,
c’est-à-dire
quand
une variablesupplémentaire
Ca est fixée en ou en [1.. Cette surface est elle-même unhypercube ]x, y [ L - q - 1 .
En raisonnant par
récurrence,
il résulte que le maximum de r2est atteintquand
toutes les
quantités
Ca sont fixées aux bornes. Parsymétrie,
la valeur de r2 est alorsdéfinie par le nombre M tel que M
quantités
Cx sont fixées en X et I, - M en !Jo( 1
:( M !1! — i).
Le maximum est obtenuquand
Mprend
pour valeur lapartie
entière N de :
ou bien la valeur extrême
( I
ou I, -I )
laplus proche
de N.Posant p =
!,/a, ce
maximun admet lamajoration:
Par ailleurs le minimum est :
il est atteint
si,
àl’exception
de deuxquantités
Ci et C2 fixéesrespectivement
enX et y, toutes les autres
quantités
Ca sontégales
à ::?,2 X + + !L il
*Ces deux cas extrêmes où toutes les contributions ne
prennent qu’une
ou deuxvaleurs
distinctes,
n’ontguère
designification biologique.
Il estremarquable
quedes variations
importantes
descontributions,
telles que p = 10 parexemple (alors
r
2 <
2 )
affectent peu laprécision
des formulesapprochées ( 2 ), ( 3 ), ( 4 ), l’écart-type
de l’erreur étant alors