COVARIANCES ENTRE APPARENTÉS QUELCONQUES
AVEC LINKAGE ET ÉPISTASIE
I. - EXPRESSION
GÉNÉRALE
A. GALLAIS
Station d’Amélioration des Plantes
fourragères, 86-Lusignan
Institut national de la Recherche agronomique
RESUME
Pour le cas de deux loci, des coefficients de parenté généralisés entre deux individus I et J,
sont définis comme la probabilité de tirer à l’un et à l’autre des loci concernés, un ensemble de gènes chez I et un ensemble de gènes chez J, en tenant compte des relations d’identité entre les gènes homologues. En supposant l’épistasie limitée à deux loci, à partir de ces coefficients, des
expressions générales de la moyenne, de la variance et de la covariance entre apparentés quel-
conques sont établies pour une population consanguine, dérivant sans sélection d’une population panmictique, illimitée, avec équilibre des phases de linkage. L’effet combiné du linkage et de l’épistasie sur les statistiques caractéristiques d’une population peut alors être précisé. Des cas particuliers déjà connus sont envisagés, à partir de l’expression générale.
INTRODUCTION
En amélioration des
plantes
ou desanimaux,
toute sélection pour un caractèrequantitatif
donné a d’autantplus
de chance d’être efficace que la variabilitégénétique
estimportante.
Une méthode desélection,
pour avoir leprogrès génétique maximum,
doit doncagir
à la fois sur la moyenne et la variance du caractèrequantitatif,
par l’intermédiaire du choixdes
unitésgénétiques
et dessystèmes
de
reproduction.
Pour utiliser au maximumles
effetsgénétiques
et leurvariabilité,
il faut donc connaître l’influence des
systèmes de reproduction
sur lavaleur
etla variabilité d’un
caractère quantitatif.
Le choix d’une méthode de sélection doit aussi être fondé sur la nature de la variabilité
génétique.
Uneexpérience
est donc nécessaire pourapprécier
lesparamètres
de cette variabilité avec différentssystèmes de reproduction. Mais, l’analyse statistique
de l’hérédité des caractèresquantitatifs
repose sur des modèlesmathématiques
construits à l’aide de certainsconcepts.
Avant touteexpérience,
destinée à orienter le choix d’une méthode de
sélection,
ilimporte
donc que le modèlelogique
etmathématique
soitdéveloppé,
avec le minimumd’hypothèses
pour avoir une
application biologique
efficace.Ces
développements mathématiques permettent
d’établir pour un caractèrequantitatif
desexpressions théoriques
de la moyenne, de la variance et de la covariance entreapparentés,
en fonction deparamètres
relatifs à l’action desgènes (additivité, dominance, épistasie),
à leur liaison(linkage)
et au mode dereproduction
utilisé.L’étude
des covariances entre individusapparentés
a pour but essentiel de fournir un modèled’analyse
descomposantes
de la variabilitégéné- tique,
depermettre
l’étude de l’influence d’unsystème
dereproduction
sur cettevariabilité et donc d’arriver à
prévoir
leprogrès génétique
propre à une méthode de sélection.C’est FISHER
( 191 8) qui
lepremier applique
les lois de l’hérédité mendélienneaux caractères
quantitatifs;
il a montréqu’il
étaitpossible
dedécomposer
lavariance
génétique
totale en variancegénétique
additive et variance due à la dominance et même variance due àl’épistasie, mais,
dans despopulations
pan-mictiques illimitées;
il a aussi donné pour cette situationl’expression
du coefficient de corrélationthéorique
entre deux individus dans des casparticuliers d’appa-
rentement. WRIGHT
( 1921 - 1922 )
introduit par la méthode des « coefficients depiste
», le coefficient deconsanguinité F,
défini comme un coefficient de corrélationgamétique.
Cette notion luipermet
degénéraliser
lesexpressions
de la corrélationthéorique
entrezygotes apparentés
etconsanguins
mais en ne considérant que l’additivité.L’originalité
del’apport
de MALECOT( 194 8)
est dans la définitionprobabiliste
du coefficient de
parenté et
du coefficient deconsanguinité f .
Ilgénéralise
ainside
façon élégante
les résultats de FISHER surl’expression
des covariances entreapparentés
nonconsanguins
d’unepopulation panmictique.
KEMPTHORNE( 1954 ,
1955,
1957 )
et COCKERHAM(1 954 , 19 6 3 ) reprenant
les résultats de Ma!,!coT lesgénéralisent
enexprimant
la covariance entreapparentés
nonconsanguins
dans une
population panmictique
avecépistasie,
mais en l’absence delinkage.
Ils donnent ainsi une
expression
de la covariance entre certainstypes d’apparentés
issus de croisement d’individus
consanguins
mais nonparents.
Gmois
(1964)
en introduisant leconcept
de situation d’identité restreinte et de coefficientd’identité,
est lepremier
à donner unegénéralisation
de la cova-riance entre
apparentés, quelles
que soient les relations deparenté
et la consan-guinité, mais,
en l’absenced’épistasie
et delinkage.
Ces résultats ont étégénéralisés
par Bou!FET2’!
( 19 66)
auxautotétraploïdes.
HARRIS( 19 6 4 ), indépendamment
<ie
G ILLOIS ,
a donné uneexpression
des covariances entreapparentés
enrégime
de
reproduction
enconsanguinité,
etgénéralisé
au casd’épistasie,
mais avecl’hypothèse
d’absence delinkage.
Une étude
générale
de l’influence dulinkage
sur les covariances entre appa- rentésquelconques
n’a pas encore été faite. SCHN!!,!,( 19 6 3 )
acependant
résolule
problème
del’expression
des covariances entreapparentés
dans unepopulation
illimitée
panmictique
enéquilibre,
aveclinkage
etépistasie.
Dans ce cas, lelinkage
sans
épistasie
nechange
rien àl’expression déjà
donnée par MAr,!cOT en194 8.
De nombreux auteurs ont abordé le
problème
del’expression
des covariancesentre
apparentés,
enrégime d’autofécondation,
en tenantcompte
dulinkage [BATE
M A
N
et MATHER(1951),
MATHER(Ig4(!),
N!LD!R(1952),
HAYMAN andM
ATHER
(I955)!.
L’étude laplus complète,
mais en l’absenced’épistasie
et avecbiallélisme,
a été celle deGATES, C OM ST O C K ,
ROBINSON(1957).
Les études faites
jusqu’ici
ne sont quepartielles. Or,
pourl’analyse
de l’hérédité d’un caractèrequantitatif,
il faut un modèlemathématique
faisant intervenir le minimumd’hypothèses,
inévitable dans l’état actuel de nos connaissancesen
génétique mathématique. Aussi,
en utilisant lesconcepts développés
par GIL-Lois
( I9 6q),
le but de cetteétude,
dans unpremier article,
est d’établir une expres- siongénérale
de la covariance entreapparentés quelconques consanguins
ou non, issus d’unepopulation illimitée, panmictique,
àl’équilibre,
avecépistasie
etlinkage.
Pour faciliter lacompréhension
desdéveloppements
et limiter leur exten-sion,
l’étude se limite au cas de deuxloci,
où à tous lesensembles,
considérésindépendants,
de deux loci.La généralisation
à L loci serait trèslongue
avec lesconcepts
utilisés. Dans un deuxièmearticle,
l’évolution des coefficientsintroduits,
sera étudiée en
régime
d’autofécondation.Les
hypothèses
de l’étudeI
. -
Diploïdie
oucomportement diploïde
à laméïose,
2
. - Absence d’effet
extra-chromosomique,
3
. - Absence d’effet de
position
sur lechromosome,
4. - Absence de
migration,
mutation etsélection,
5. -
Population
dedépart illimitée, panmictique,
enéquilibre
delinkage.
La
première hypothèse
limite l’étude auxespèces
àcomportement diploïde
à la méïose.
I,’extension
des résultats auxespèces autotétraploïdes
estpossible
à
envisager,
avec certainesdifficultés,
dues au nombre deparamètres
en utilisantles
concepts développés
par BOUFFETTE( 19 66).
Le manque de
connaissance approfondie
sur les mécanismes de l’héréditécytoplasmique
rend actuellement difficile l’introduction de ceparamètre
dansles modèles de
mathématique génétique.
L’effet de
position
estdistingué
ici de l’interaction entregènes
non allèles.Il serait
possible
d’inclure dans l’étude unparamètre
deposition
« Cis o ou « Trans u.Mais,
dans cettepremière approche
duproblème,
nous ne l’avons pas fait.L’absence de
sélection,
naturelle ou artificielle revient à attribuer uneparti- cipation égale
dechaque génotype,
àchaque génération,
pour la formation de lagénération
suivante. Dans uneexpérience,
il est certes difficile d’éliminer la sélection au niveaugamétique,
mais une certaine sélection au niveauzygotique peut
être évitée. Les deuxhypothèses classiques
d’absence demigration
et desélection ne semblent pas graves et
pourraient
d’ailleurs être levées.Enfin la
cinquième hypothèse
limite l’étude auxpopulations
illimitées pan-mictique,
enéquilibre
dupoint
de vue dulinkage. L’hypothèse
d’effectif illimité et depanmixie
en l’absence de sélectionpermet
de considérer que desgènes
nonidentiques,
au sens deGmois ( I9 6q.),
sontindépendants. Nous
excluons ainsitoute relation de
dépendance
entregènes
allèles.L’hypothèse d’équilibre
delinkage,
en l’absence de
sélection, permettra
de considérerqu’à
tout moment les «phases
»de deux
gènes
non allèles sont enfréquence égale :
P =Q
=i /2 (voir figure).
Nous introduisons ici les termes « Cis » et « Trans » au lieu des termes
classiques
de «
couplage
» et« répulsion
» introduit parM ATHER ,
pour ne pas faired’hypothèse
sur la dominance et le nombre d’allèles à un locus. Dans une
population panmic- tique, l’équilibre
des deuxphases
est atteint defaçon asymptotique,
et d’autantplus
lentement que le taux de recombinaison(!)
estfaible,
m
représentant
le nombre degénérations
demultiplication
enpanmixie,
yi,la
fréquence
desgamètes portant
lesgènes
i etk,de fréquences respectives fi ;
etP k .
Par suite de cette
hypothèse,
lesexpressions
établies nepermettront
pas de retrouver lesexpressions correspondant
à la liaison absolue(!
=o), équiva-
lentes des
expressions correspondant
à unlocus,
etqui supposent :
I,e raisonnement
plus général qui permettrait d’englober
ce cas n’a pas étéenvisagé.
Nous supposerons donc dans ce
qui
suit que leparamètre
derecombinaison P
est tel que :
. - 1
1. - LES CONCEPTS
UTILISÉS
GÉNÉRALISATION
DU COEFFICIENT DEPARENTÉ
1
. - La relation d’identité
pour
une classed’homologues
« La relation d’identité induit sur l’ensemble des
gènes
d’une classe d’homo-logues
unepartition
en sous-ensemblesdisjoints appelée
situation d’identité res-treinte. Toute
probabilité
attachée à une situation d’identité restreinte est uncoefficient
d’identité restreinte »[Gmois ( 19 6 4 )].
L’ordre d’une situation d’identité restreinte étant le nombre de loci homo-
logues considérés,
et son rang le nombre dezygotes
entrelesquels
se distribuentses
loci,
nous allons considérer les situations d’identité restreinte d’ordre 4 et de rang 2. En tenantcompte
del’origine paternelle
ou maternelle desgènes,
(*) Cours de Génétique mathématique, Faculté des Sciences de Paris, en 1963.
elles sont au nombre de 15
(tabl.
i,Giriois, 19 6 4 ). Sans
tenircompte
del’origine
des
gènes,
sachant que deux sontpris
dans lezygote I,
deux dans lezygote J,
on
distingue
seulement 7 situations d’identité restreinte(tabl. 2 ).
Nous noterons ces situations d’identité en écrivant la
répartition
entre lesdeux
zygotes (trait vertical)
desgènes identiques
dechaque
classe d’identité renfermant au moins deuxgènes quelle
que soit leurorigine,
la situationSolo signifiant
l’absence de relation d’identité dans l’ensembledes quatre gènes
homo-logues.
Cette notation adéjà
été utilisée par BOUFFETTE( 19 66)
pour les tétra-ploïdes.
Nous pouvons remarquer que certaines des situations décrites sont des sous-ensembles de situations d’identité restreinte introduites par GILLOIS(ig6q.).
A
chaque
situationd’identité,
nous pouvons attacher uncoefficient
d’identitérestreinte.
D’autres situations et coefficients d’identité restreinte
peuvent
êtredéfinis,
dontl’importance apparaît clairement lors
de l’étude des covariances entre appa- rentés. Ces situationsreprésentent
larépartition
entre 2zygotes
desgènes
iden-tiques
pour destirages
de 2, 3 et 4gènes quel
que soit l’état des autresgènes
non tirés
(tabl. 3 ).
Les coefficients d’identité restreinte attachés à
chaque
situation d’identité décrite dans le tableau 3 sont lescoefficients de parentés généralis ’ és.
Le coefficient deparenté
cpij de deux individus I etJ
définis par MALECOTcomme « laprobabilité
pour que deux
gènes
tirés l’un chezI,
l’autrechez J
soientidentiques
par descen- dancemendélienne,
en l’absence de mutation » est un coefficient d’identité restreinteparticulier.
I,e coeihcient d’identité restreinte
q¡ 2 ¡?
attaché à la situation d’identité restreinte2/. l {
n’est autre que le coefficient deconsanguinité
de l’individu I :Ainsi le coefficient de
parenté
de Mnr,!COT 9v, et le coefficient de consan-guinité f,
sont des coefficients d’identitéparticuliers.
Les coefficients d’identité restreinte définis comme des coefficients deparenté généralisés
interviennent directement dansl’expression
de la covariance donnée parG ILLOIS (1 9 64) :
2
. - Généralisation à
plusieurs
classesd’homologues a)
Situations d’identitéPour classe
d’homologues,
le nombre de situations d’identité restreinte devient trèsgrand,
même sans tenircompte
del’origine
desgènes.
Nous limiteronsnotre étude au cas de l = 2. Dans ce cas, sans tenir
compte
del’origine
desgènes
nous aurons 53 situations d’identité restreinte de rang 2 et d’ordre ,¢-4
( 2 zygotes
et 4
gènes
tirés àchaque locus),
en admettant que lesprobabilités
attachéesaux situations
symétriques
ne soient paségales.
Avec leshypothèses faites,
il y a(
*
) Les probabilités 7ri sont celles définies au tableau 2.
symétrie,
et iln’y
a que 31 situations d’identité restreinte de rang 2 et d’ordre 4-4comme le montre le tableau de leur formation
(tabl. q)
avecP, (i
= 1 à31 )
lescoefficients d’identité restreinte attachés à ces
probabilités.
I,a notation des situations d’identité restreinte
exprime
larépartition
desgènes identiques
danschaque zygote
1 et J; pour chacun des deuxloci, chaque
situation non
symétrique
en Iet j
est l’union de deuxsituations,
parexemple :
donc
Le trait horizontal
sépare
les deux classesd’homologues,
ainsi on écrira :b) Coefficients
deparenté généralisés
Ces situations d’identité restreintes étant
définies,
il estpossible d’introduire,
comme dans le cas d’une classe
d’homologues,
des situations d’identitéparti- culières, auxquelles
nous attacherons descoefficients
d’identitérestreinte, géné-
ralisation des
coefficients de parenté.
Parhomogénéité
avec cequi précède,
nous) I j
les
noteroils !IXIJX
sans écrire les situationssymétriques (tabl. 5 )
et ne retenant/ xix B
que ceux
qui
seront utiles par la suite.Ires
tirages
neportant
que sur unlocus ¡ (!), I ?1 et (1) quelle
que soit
l’origine
desgènes,
conduisent évidemmentaux coefficients de parenté
définisprécédemment
pour une classed’homologues.
I,e raisonnement
présenté
icidépasse
celui de SHrKnTn( 19 65) :
SatxnTnreconnaissait les limites de sa
généralisation.
Eneffet,
les seuls coefficients deparenté
définis par SHZxnTepeuvent
s’écrire avec une notationanalogue
à celleintroduite,
mais faisantfigurer
toutes les classes d’identité :c) Coefficients de consanguinité généralisés
Les coefficients de
consanguinité
ne sontqu’un
casparticulier
des coefficients deparenté,
letirage
neportant
que dans un seul individu. Paranalogie
avecla définition du coefficient de
consanguinité
à unlocus,
il estpossible
de définirle coefficient de
consanguinité généralisé
pour 2 loci comme laprobabilité
d’avoir2
gènes identiques
à chacun des 2loci;
ainsi nous noterons :f !2! représentant
le coefficient deconsanguinité
à un locus défini par MAr,!COT.Mais ces coefficients ne donnent pas une
description complète
des états d’identitépossible
à chacun des 2 loci : pourcela,
il faut introduire les situations d’identité de rang i, faisant intervenir les q.gènes,
et schématisées dans lafigure
2.Il est immédiat que :
et
A 2 , A’ 21 Â 3 pourraient
s’écrireLes coefficients. introduits par SHIKATA sont alors tels que :
d) Expression
descoefficients
deparenté généralisés
enfonction
desprobabilités
attachées aux situations d’identité
Chaque
coefficient deparenté peut
êtreexprimé
sous forme d’une combinaison linéaire desprobabilités P i
attachées àchaque
situation d’identité restreinte définies dans le tableau 4. Les résultats sont donnés en annexe.’
II. - LES VARIABLES
ARATOIRES GÉNÉTIQUES
I
. - Structure d’une
population consanguine
Soit G la variable aléatoire
génotypique
etG(ij)(k¡)
la mesure du caractère étudié sur unzygote
degénotype !4j!4jB!B;,
i
et j pour
les allèlesprésents
au locus Ak et
1 pour
les allèlesprésents
au locus BG
prend
autant de valeursqu’il
y a degénotypes possibles.
Le tableau 6 suivant
indique
les différentescatégories
degénotypes,
leurvaleur et leurs
probabilités
dans lapopulation.
Avec
équilibre
delinkage
audépart,
la structure de lapopulation
consan-guine
s’écritdonc, avec 1 # j # k # l,
et en tenantcompte
de l’ordre des allèlesprésents
à un locus :2
. -
Définitions
et estimations des aléatoiresgénétiques a)
Variable aléatoiregénique
I,’effet
d’ungène
se manifeste par une contributionnumérique
àl’expression
d’un caractère. Soit
X I
la contribution de l’allèleA i ;
par définition la variable aléatoire Xprend
la valeurX I
avec laprobabilité p i .
L’estimation
que nous pouvons avoir deX i
est donnée par la moyenne des valeurs desgénotypes ayant
leursgènes homologues
nonidentiques
etportant
l’allèle.4;
au locus A :condition
c, i fixé;
c’estl’hypothèse d’équilibre
delinkage
dans lapopulation, qui permet
d’écrire le dernier membre del’égalité.
b)
Variable aléatoire de dominance DDeux
gènes
allèlesi et j présents
dans lezygote
considéréapportent
à la réalisation du caractère une contributionnumérique globale G ij . L’interaction
entre ces 2
gènes permet
de définir la valeurD, j
queprend
la variable aléatoire D avec laprobabilité P iPi
I,’estimation
deG, j
est :c)
Variable aléatoired’épistasie
IIl faut
distinguer
3types
de variables aléatoiresd’épistasie :
10 Celles
qui
font intervenir deuxgènes
non allèles :Soit i et k deux tels
gènes,
paranalogie
avec la définition de l’aléatoire dedominance,
nous aurons:nous posons
2° Celles
qui
font intervenir deuxgènes
allèles et ungène
non allèle :3
0
Cellesqui
font intervenir lesquatre gènes:
d) Propriétés
des aléatoiresgénétiques
Définies à
partir
d’unepopulation
enéquilibre
delinkage,
les aléatoiresgénétiques
montrent certainespropriétés qui
seront utilisées.W En centrant l’aléatoire
zygotique G tJkl’
il résulted’après
le théorème des moyennes conditionnées et la définition des aléatoires :2
0
Espérances
d’aléatoires avec allèlesidentiques :
nous savons
déjà
queE(D ji ) !
o(G ILLOIS , 19 6 4 ).
Demême,
on montre que :Lorsque
dans la conditionenvisagée
ungène
n’est pasidentique
à l’un desautres
gènes, l’espérance
conditionnéecorrespondante
est nulle. Ainsi :condition
c,
i fixéor
d’où
De même :
3
0 Espérances
duproduit
de deux aléatoires:GILLOIS
(1964)
a montré que:et
De
même,
parl’application
du théorème des moyennes conditionnées :or
d’où
Il en est de même pour tout
produit
de deux aléatoires dès quefigure
dansl’une d’elles un
gène
nonidentique
à l’unquelconque
des autresgènes correspondant
à ces aléatoires.
Par
exemple :
mais
III. - EXPRESSION
G!N!RAI,$
DE LA MOYENNE,DE I,A VARIANCE ET DE LA COVARIANCE ENTRE
APPARENTÉS
I
. -
Expression de la
moyenne d’unepopulation consanguine
D’après
lespropriétés
des aléatoiresgénétiques,
et parapplication
du théorème des moyennes conditionnées :/(
2
)
étant le coefficient deconsanguinité classique
etf( 2.2 )
=. : :11>
lagénéralisation
du coefficient de
consanguinité
à deux loci.Il en résulte que la variable aléatoire
génotypique
a pour moyenne :G est une variable aléatoire centrée par
rapport
à la moyenne de lapopulation panmictique.
Dans le casd’indépendance :
nous retrouvons là dans ce cas
particulier
un résultatdéjà
établi par KEMP-T HORN
E
( 1957 ).
En l’absenced’épistasie,
lelinkage
nepeut
avoir aucun effet surla moyenne. Ce résultat a
déjà
été donné par MATHER(igqg).
En faisant la somma-tion sur tous les
couples de loci, l’expression
de la moyenne devient en attribuantun
f( 2 , 2 )
àchaque couple :
L’expression qui
résulte de la sommation est doncimmédiate,
àpartir
desrésultats relatifs à deux loci.
Ainsi,
poursimplifier l’écriture,
dans cequi suit,
la sommation sur tous les
couples
de loci ne sera pas faite.2
. -
Expression de la
covariance entre deuxzygotes 1 et J
En notant
i, j, k,
1 lesgènes
duzygote
I. et pari’, j’, k’, l’,
lesgènes
duzygote J, l’espérance
duproduit
des aléatoiresZIZI peut
sedécomposer
comme suit :Méthode de calcul des
différentes espérances:
En
appliquant
lapropriété
duproduit
de deuxaléatoires
oùfigure
dans l’une d’elles ungène
nonidentique
à l’unquelconque
des autresgènes correspondant
à ces
aléatoires,
il est desespérances qui
sont immédiatementnulles,
parexemple :
Les autres
espérances
sedécomposent
parapplication
du théorème des moyen-nes conditionnées et se
simplifient
parapplication
de lapropriété
duproduit
de deux aléatoires.
De même on montre que :
Ces résultats ont
déjà
été donnés par GILLOIS( 19 6 4 ).
Pour lesespérances
faisant intervenir une ou deux aléatoires
d’épistasie,
le même raisonnements’applique.
IJ J
Les
tirages
nonsymétriques
en Iet J peuvent
êtreregroupés;
parexemple,
on a:
et
or
d’où
et par
symétrie
or, avec nos
hypothèses:
la somme
( 1 )
+( 2 )
s’écrira donc :L’écriture
finale del’espérance
duproduit
des deux aléatoiresgénotypiques
est donnée
ci-dessous,
en attachanttoujours
lesgènes
iet j au
locus no i,et
k,
1 au locus n° 2. Pourl’homogénéité d’écriture, l’espérance
duproduit
dedeux aléatoires
orthogonales
estgardée
sous sa formeinitiale;
parexemple :
E(D,,D,j) pourrait
s’écrire :!e
produit
desespérances
à pourexpression:
L’expression
de la covariance est immédiate :3
. -
Expression de la
varianceL’expression
de la variance se déduit immédiatement del’expression
de lavariance en faisant I =
J.
Dans ce cas,f, 2 ) I
=/( 2 ) j
et/( 2 ,,) l
=/( 2 , 2 ) J -
Les situations d’identité restreinte se limitent à q :
Ce
qui
annule 6 coefficients deparenté
sur2 8;
il nefigurera
dans la variance que 22 termes au lieu de 28 dans la covariance.4.
-Étude de
casparticuliers
Covariance entre
apparentés quelconques, consanguins
10 Absence
d’épistasie
et delinkage
C’est l’extension à deux loci
indépendants
del’expression
donnée par GiLLois( 19 6 4
).
En utilisant la sommation sur1 loci,
pour les différentescomposantes,
la
généralisation
à un ensemble de 1 lociindépendants
est immédiate.2
0
Linkage
avec absenced’épistasie
Dans ce cas, il
s’ajoute
àl’expression précédente
unequantité
caractérisant les covariances entre les aléatoiresgénotypiques
des deux lociG(&dquo;
etGj 2 )
d’unepart
etG!2) G’ j &dquo;
d’autrepart,
dont la somme a pourexpression :
dans le cas
particulier d’indépendance :
la covariance entre les aléatoires des deux loci est nulle et nous retrouvons
l’expres-
sion
précédente.
3
0
Liaison absolueAvec les
hypothèses faites,
il n’estthéoriquement
paspossible d’envisager
ce cas. Certains résultats sont toutefois
immédiats,
ouparticuliers : f(2
,
2)
devientf( 2J
et seules ont un sens les
espérances
rassemblées dans le tableau suivant avec leurinterprétation
et leur coefficient deparenté correspondant (tabl. 8).
Avec ces
relations, l’expression générale
reconduit donc àl’expression
donnéepar GILLOIS
(1964).
q.! Indépendance 1
Chaque
coef6cient deparenté
relatif à destirages portant
aux deux lociest alors
égal
auproduit
des coefficients deparenté
attachés à chacun des deux loci considérésséparément. Ainsi,
parexemple:
Notre
expression
conduit alors aux résultats de HARRIS( 19 6 4 )
pour 2 loci.Covariance entre
apparentés
dans unepopulation panmictique
Toutes les
espérances
renfermant des aléatoires avec des allèlesidentiques
sont nulles :
’
Dans le cas
d’indépendance totale,
nousretrouvons
les résultats de KEMP-T HORN
E
( 1957 )
avec : 1< ,
et en
posant :
d’où la formule
classique
de KEMPTHORNE(1957)
et COCKERHAM(1954)
Dans le cas de liaison
quelconque,
nous retrouvons les résultats de SCHNELL(1 9 6 1 ).
. , 1111 ..11 11,
5
0
Autrefo y mulation de la
covariance et de la variance avec un modèle’ global
Soit Gn»2> la valeur du
génotype
attachée aux loci(i)
et( 2 )
et GW la valeur attachée au locus n° i et GW la valeur attachéeau
locus n° 2, nous pouvonsécrire,
en centrant les valeurs :
H(
1 )(
2
)
désignant
la variable aléatoired’épistasie;
ainsi parexemple
pour ungénotype A P) A 51B A !2) A 12B :
.Nous allons considérer
G(1),
G(2) et HW2! comme des variables aléatoiressimples. I,’expression générale
de la covariance entre deux individus Iet 1
seradonc :
Les variables aléatoires utilisées dans ce modèle
global possèdent
des pro-priétés analogues
à celles dupremier
modèle. Enparticulier :
Dans le tableau 9 nous donnons les résultats.
Le terme correctif à pour
expression :
Il y a donc 28 termes soit autant que dans le
premier
modèle. Au niveau de la variance iln’y
a que io termes au lieu de 22 : ce modèlepeut
donc être utilisé dans certaines conditions. En considérant comme seule variable aléatoire la variable aléatoiregénotypique,
il est mêmepossible d’exprimer
la variance seulementen fonction de 6
paramètres :
De telles
décompositions,
en limitant le nombre deparamètres
àestimer, peuvent
être d’intérêt dans certainessituations,
selonl’objectif poursuivi.
CONCLUSIONS
La contribution de cette étude
peut
se situer à deux niveaux. Au niveau des moyennes, ellepermettra
uneinterprétation
de résultats concernant l’influence de laconsanguinité
avecépistasie
etlinkage,
et, bienqu’elle
se limite à l’ensemblede tous les
couples
deloci,
considérésindépendants,
elle doitpermettre
une pre- mièreapproche
de l’influence del’épistasie
aveclinkage.
Au niveau de l’étude de la variabilitégénétique, de
sa nature et de son évolution au cours de lareproduction
selon un
système consanguin particulier,
elleapporte
un modèlemathématique indispensable,
d’unepart
pour l’étude de l’efficacité d’une méthode desélection,
et d’autre
part,
pourl’interprétation d’expériences
destinées à orienter le choix de la méthode laplus
efficace dans le matériel dont ondispose.
L’hypothèse
d’absence de sélectionqui
a été faite limite certes l’utilisation de cette étude pour la théorie de la sélection artificielle dans lespopulations consanguines
à un seulcycle
desélection,
c’est-à-dire à une àplusieurs générations
de
reproduction
enconsanguinité,
avant la sélection. Un seulcycle
de sélectionpeut déjà apporter
des informations très intéressantes sur l’efficacité d’un schéma de sélection.I,’influence
d’une sélectionpendant
laphase
deconsanguinité,
surl’intensité de la sélection
possible
au niveau de laphase
de croisement est encoremal connue, tant du
point
de vuethéorique qu’expérimental.
Avec les
concepts utilisés,
le nombre deparamètres
nécessaires pour décrire la variabilitégénétique
d’un caractèrequantitatif
devient vite trèsgrand
dèsque l’on ne veut pas faire
d’hypothèses trop
restrictives surl’importance
desrelations
d’épistasie.
C’est un obstacle trèsimportant
pour l’estimation des compo- santes de la variabilitégénétique.
Apartir
del’expression générale établie,
dessituations
particulières
entraînant une diminution du nombre deparamètres, pourront
être recherchées(par exemple, populations bialléliques;
de telles popu- lations sontpossibles
à réaliser chez lemaïs).
Desplans d’expériences
conduisantnon pas à l’estimation de tous les
paramètres,
mais à un nombre limité de fonc- tions de cesparamètres
devront être établis. Certaines méthodes del’analyse
multivariable
pourraient
aussi êtreemployées
dans ce but.Reçu Pour publication
en mai 1970.REMERCIEMENTS
Nous tenons à adresser de très vifs remerciements à M. LEFORT, Professeur de Mathématiques
à l’Institut National Agronomique qui a bien voulu critiquer et vérifier tous nos développements mathématiques et M. CHEVALET, Chargé de Recherches à la Station de Génétique animale du
C.N.R.Z. qui a accepté de relire
le
texte. Mais, c’est grâce à M. GILLOIS, Maître de Recherches à la Station de Génétique animale du C.N.R.Z., que cette étude a pu voir le jour; nous lui ensommes très reconnaissants. Enfin, dans nos remerciements, nous n’oublions pas Monsieur le Professeur MALÉCOT qui a bien voulu apporter sa contribution par la lecture critique de cette
étude.
SUMMARY
COVARIANCES BETWEEN ARBITRARY RELATIVES WITH LINKAGE AND EPISTASIS
I. - GENERAL EXPRESSION
Generalized coefficients of relationship between two individuals, I and J, are defined for two loci as the probability of drawing from one and the other of the loci a group of I genes and a group of J genes, taking into account the identity relationships between homologous genes.
Supposing that epistasis is limited to two loci,
general
expressions of the mean, variance andcovariance
between relatives are established from these coefficients for an inbred populationderived without selection from an unlimited random-mating population with linkage-phase
balance. The combined effects of linkage and epistasis on the characteristic statistics of a
population may then be studied. From the general expression already known cases are consi-
dered.
RÉFÉRENCES BIBLIOGRAPHIQUES
B ATEMAN
A. J., MATHERK., 1951. The progress of inbreeding in barley. Heyedity, 8, 321-348. ·
BOUFFETTE J., 1966. Expression de la covariance génotypigue chez les tétraploïdes. Thèse doctorat 3ecycle, Fac. Sci. Lyon.
C
OCKERHAM C. C., 1954. An extension of the concept of partitioning heriditary variance for analysis of covariances among relatives when epistasis is present. Genetics, 39, 859-882.
C OCKERHAM
C. C., 1963. Estimation of genetic variances. In W. D. HANSON, H. F. ROBINSON. Statis- tical Genetics and Plant Breeding Pub Watl. Acad. Sci. Natl. pres. Council 982, 53-93.
C OMSTOCK
R. E., ROBINSON H. F., 1952. Estimation of average dominance of genes. In J. GowErr, Heterosis, Iowa State College Press, 494-516.
FiS
HER R. A., 1918. The correlation between relatives on the supposition of Mendelian inheritance.
Trans. Roy. Soc. Edinburgh, 52, 399-433.
GATES C. E., ComsTocK R. E., ROBINSON H. F., 1957. Generalized genetic variance and covariance formulate for self-fertilized crops assuming linkage. Genetics, 42, 749-763.
G
ALLAIS A., 1968. Interactions between alleles and their variability in autotetraploid cross-fertilized plants. Consequences for selection. V Congress of Eucarpia, Milan 1-2 october.
G
ILLOISM., 1964. La relation d’identité en génétique. Thèse Fac. Sc. Paris.
GiLLois M., 1967. La notion de génotype. Annales de Génétique, 10, 201-202. H
AYMAN
, MATHER, 1955. The description of genic interactions in continuous variation. Biometrics, 11, 69-82.
H ARRIS
D. L., 1964. Biometrical parameters of self fertilized diploid populations. Genetics, 50, 931-956.
ILu!Ris D. I,., 1964. Genotypic covariances between inbred relatives. Genetics, 50, 1319-1348.
K
EMPTHORNEO., 1954. The corrélation between relatives in a random mating population. Proc. Royal.
Soc. London, B, 143, 103-113. K
EMPTHORNE O., r957. An introduction to genetic statistics. J. Wiley, New-York, 545 P. M
ALECOT G., 1948. Les mzthématiques de l’hérédité. Maison et Cie, Paris, 63 p.
M
ATHER K., 1949. Biometrical genetics. Methuen and Company I,td, I!ondon.
N
ELDER S. A., 1952. Some genotypic frequencies and variance components occuring in biometrical genetics. Heredity, 6, 387-394.
S CHNELL
F. W., 1961. Some general formulations of linkage effects in inbreeding. Genetics, 46, 947- 957.
SCH!Lr. F. W., 1963. The covariance between relatives in the presence of linkage. In W. D. HANSON,
H. F. ROBINSON; Statistical genetics and Plant Breeding. Natl. Acad. Sci. Natl. Res. Council Pub.
( 9 8 2 ), 468-483. S
HIKATAM., 1962. The generalized inbreeding coefficient in a Markov process. Rep. Stat. APPI. Res.
Juse, 9, 127-136.
SiiiKATA M., 1963. Représentation and calculation of selfed populations by group ring. J. Theoret.
Biol., 5, 142-160. S
HIKATAM., 1965. A generalization of the inbreeding coefficient. Biometyics, 21, 665-681.
W
RIGHT S., 1921. Systems of mating. II. The effects of inbreeding on the genetics composition of
a population. Genetics, 6, 124-143. W
RIGHT
, 1922. Coefficients of inbreeding and relationship. Amer. Natur., 56, 330-338.