A NNALES DE L ’I. H. P., SECTION B
M. G ILLOIS
Relation d’identité en génétique I. - Postulats et axiomes mendéliens
Annales de l’I. H. P., section B, tome 2, n
o1 (1965), p. 1-94
<http://www.numdam.org/item?id=AIHPB_1965__2_1_1_0>
© Gauthier-Villars, 1965, tous droits réservés.
L’accès aux archives de la revue « Annales de l’I. H. P., section B » (http://www.elsevier.com/locate/anihpb) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
Relation d’identité
engénétique
I.
2014Postulats
etaxiomes mendéliens
M. GILLOIS
Station Centrale de
Génétique animale,
Centre National de Recherches
zootechniques, Jouy-en-Josas (S.-et-O.),
I. N. R. A.
V ol.
H,
n°1, 1965,
p. 1-94. Calcul des Probabilités etStatistique.
SOMMAIRE
I. Introduction ... 1
II.
L’analyse
de la méiose chez unpyrénomycète...
2III. Les
objets
de la théorie de l’hérédité et leurs relations .... 5 IV. Les différents aspects de la relation d’identité... 16 V.Les
situations et les coefficients d’identité restreinte... 20 Vs Les situations et les coefficients d’identitégénéralisée
d’ordre 2.. 32VII. Les
tirages gamétiques multiples
dans un même zygote .... 33VIII. Conclusion ... 35
IX. Résumé... 0 ... * 36
X.
Bibliographie
... 37I. -
INTRODUCTION
Depuis
que des études trèspoussées
ont abordé soit la structure fine dugène,
soit les conditionspermettant l’expression
despotentialités
d’ungène,
il n’existeplus
de « bonsgènes
». Enfait,
la notion degène qui
a étédégagée
des résultats desexpériences d’hybridation
sexuelle est à la foisprécise
et floue.C’est,
engénétique classique,
une unité discontinue de fonc-ANN. INST. POINCARÉ, B-H-1 1
1
2 M. GILLOIS
tion,
deduplication,
demutation,
de recombinaison. Le motfonction
estpris
dans un sens assez vague, ils’agit
de l’ensemble desphénomènes
aboutissant
àl’expression
d’un caractère donné(ailes longues
de la droso-le).
Au cours des divisions cellulaires indirectes(mitose
et"
nib ; unité discontinue,
donne naissance par «duplication ))
àd’autres
gènes généralement identiques
augène
ancêtre. Maisparfois
laduplication
est incorrectepuisqu’un gène
descendant D’aplus
la mêmefonction que le
gène ancêtre,
un telphénomène
est une mutation. Legène
est enfin une unité de recombinaison. Les
segments
des chromosomes peu- vent êtreséparés
par lecrossing-over,
alors que lesgènes
eux-mêmes nesont pas
susceptibles
d’être scindés.Mais
l’augmentation
dupouvoir
de résolution desexpériences d’hybri-
dation sexuelle
(et parasexuelle
desmicroorganismes), après
avoir renduune
image
floue dugène,
a fait éclater la notion même dugène
dont lesdébris
épars
sont lescistrons,
les recons, les mutons, lespolarons
et lesopérons.
Pour un critère
qualitatif (morphologique
oubiochimique)
la notion de« bon
gène » dépend
en fait dupourcentage
minimum de recombinaisons que les testsstatistiques permettent
de détecter au cours desexpériences d’hybridation.
Les modèles
mathématiques
que nous allons exposerreposent
exclusi-vement sur
l’analyse
des conclusions desexpériences d’hybridation
sexuellequi
ontpermis
dedégager
la notion degène.
II. - L’ANALYSE DE LA
MÉIOSE
CHEZ UN
PYRÉNOMYCÈTE
Soient deux souches d’un
champignon pyrénomycète
Bombardia lunata dont l’une sauvage(S)
a les ascopores noires à maturité et unmycélium
très
pigmenté,
et dont l’autre dite lactea(L)
a les ascopores blanches et unmycélium
nonpigmenté.
Ils’agit
de deux « races » pures neproduisant
cha-cune que des
gamétophytes
d’un seultype.
Les asques despérithèces
d’uncroisement d’une souche sauvage et d’une souche
lactea,
les deux souchesayant
dessignes
sexuelscomplémentaires, appartiennent
à six types, sché- matisés ci-contre(fig. 1).
Chacun de ces asques est le résultat d’une seule méiose et les
généticiens
présentent
de la méiosel’analyse génétique suivante,
quenous
illustrons dans le cas del’asque
nO 3(tableau I).
Pour
expliquer
la transmissionpotentielle
des caractères sauvage et lactea au travers de la méiose nous supposons l’existence d’unobjet appelé gène, support
de l’information nécessaire àl’expression
des caractères. Cetobjet
est discontinu etquasi
stable et serepère
sur unpoint
duchromosome,
considéré comme un
segment
de droite orientéeappelé
carte chromoso-mique.
Numérotons de 1 à 8 les huit
gènes
del’asque
final de notreexemple.
Les
gènes 1, 2, 5,
6 dérivent parduplication
dugène S,
dont ils sont enl’absence de mutation la
copie biochimique.
Cesgènes
sont par définitionidentiques
entre eux. Lesgènes 3, 4, 7,
8 sont pour les mêmes raisons iden-tiques
entre eux parce quecopie
d’ungène
L. Il en est de même desgènes, I, III,
et desgènes II, IV, appartenant
àl’asque
issu de la méiose. Parce que lesgènes I, II, III,
IV s’excluent mutuellement dans lesquatre
noyaux appar- tenant àl’asque produit
par laméiose,
lesgènes
ancêtres S et L sont ditspar définition
homologues.
Lesgènes I, II, III,
IV s’excluent mutuellement4 M. GILLOIS
dans les
quatre
noyauxproduits
par cetteméiose,
aussi lesgènes
ancêtres Set L
qui
ont des fonctions distinctes sont dits allèles par définition.Si nous avions observé un asque issu d’un croisement entre deux souches de
signes
sexuelscomplémentaires
de Bombardia lunata sauvage, lesgènes S+
et S- du
dicaryote, puis
duzygote,
seraient ditsisoactifs
parce que leursdescendants s’excluent dans les
quatre produits haploïdes
de la méiose etqu’ils
ont même action sur un même caractère.III. - LES
OBJETS
DE LATHÉORIE GÉNÉTIQUE
DE
L’HÉRÉDITÉ
ET LEURS RELATIONSNous voulons
atteindre,
au moyen dedémonstrations,
un certain nombre de résultatsmathématiques applicables
à laGénétique. Or, trop
souvent, les démonstrations àl’usage
desphysiciens
et desbiologistes
ne sont cons-tituées que par des calculs
qui apportent
la conclusion d’une manière ino-pinée. Aussi,
pourdégager
les notions fondamentales dont lespropriétés permettent
cescalculs,
tenterons-nous unexposé axiomatique
de lagéné- tique,
c’est-à-dire que nous décrirons lesconcepts
ouobjets
de la théoriegénétique
etchromosomique
de l’hérédité et que nous énoncerons les rela- tionsqui
existent entre cesobjets.
Les
objets
sont décrits par le nombre minimum d’attributs nécessaires et suffisants audéveloppement
non contradictoire de la théorie et à l’obtention de résultatsmathématiques
utilisables dansl’interprétation d’expériences
ou d’observations.
Ces attributs sont choisis
indépendants
entre eux, non contradictoires et tels quel’expérience biologique,
dans certaines limites deprécision,
lesassure comme certains.
Puisque
les relationsqui
existent entre cesobjets
nous sont données parl’expérience,
nous les étudieronssystématiquement
afin de les identifier auxrelations définies par les mathématiciens.
1. Les notions de
gènes,
degamètes,
dezygotes.
Nous donnons du
gène
la définition suivante : «quantité
d’informationbiologique quasi
stable(I)
dontl’hypothèse
d’existence est nécessaire(et
(1)
Dansl’hypothèse
de l’absence demutations,
cettequantité
sera dite stable.6 M. GILLOIS
suffisante)
pourexpliquer
la transmission des caractèresqualitatifs repé-
rables
qu’elle
conditionne au cours de la méiose et de la fécondation ».Il est, de
plus,
nécessaire(et suffisant)
de supposer que lesgamètes
contien-nent chacun un
gène -
ils sont ditshaploïdes -
et leszygotes
chacun deuxgènes -
ils sont ditsdiploïdes (2).
2. Les notions de
population,
degénération.
Nous
appelons population
la succession ordonnée degénérations
dis-jointes (3).
Nousdésignons
pargénération
lecycle
ordonné d’unegénération zygotique,
d’unegénération zygotique utile,
d’unegénération gamétique,
d’une
génération gamétique
utile. Lagénération zygotique
est un ensemblede
zygotes contemporains.
Lagénération zygotique
utile est un sous-ensemble de la
génération zygotique,
c’est l’ensemble deszygotes qui
four-nissent,
à la suite desméioses,
lesgamètes
de la mêmegénération.
Lagéné-
ration
gamétique
est un ensemble degamètes contemporains.
Lagénération gamétique
utile est l’ensemble desgamètes qui,
unis deux àdeux, parti- cipent
effectivement à la constitution de lagénération zygotique suivante,
dont les
zygotes
sont par définitioncontemporains.
Nousappelons
popu- lationzygotique
l’ensemble desgénérations zygotiques
d’unepopulation.
Nous
appelons
groupezygotique
un ensemble arbitraire dezygotes.
Toutepopulation
et toutegénération zygotique
sont donc des groupes(4).
Il enest de même pour les
générations
et lespopulations gamétiques.
3.
L’homologie
desgènes.
L’ensemble 9 de tous les
gènes présents
dans unepopulation zygotique
est le
génotype général.
L’ensemble G de tous lesgènes présents
dans unzygote
est legénotype particulier
ou individuel de cezygote.
Il est immédiat que :i
et j
étant des indicesrepérant
leszygotes.
(2)
En excluant le cas des gènes liés au sexe, que nouspourrions
d’ailleurs intro- duire.(3)
Dans le cas d’unepopulation quelconque,
il esttoujours possible
de se réduireà ce schéma en considérant l’intervalle moyen entre
générations.
(4) Qualitatif
sans rapport avec le « groupe » des mathématiciens.Supposons
que Gsoit
un ensemble fini. Au cours d’une méiose nousdirons que deux
gènes
sont liés par la relationd’homologie,
desymbole JÉ, si,
et seulement si
(5),
ils s’excluent dans les quatreproduits haploides
de cetteméiose.
La relation
d’homologie
est donc une relation binairequi possède
lespropriétés
suivantes :Elle est réflexive : .
Elle est transitive :
Elle est
symétrique :
La relation
d’homologie
est donc une relationd’équivalence.
En consé-quence, cette relation réalise une
partition
de l’ensemble desgènes
d’ungénotype général
en sous-ensemblesdisjoints
chacunappelé
classe d’homo-logues.
Si l’on considère ces sous-ensembles comme les éléments d’un nouvel
ensemble,
ce dernier est l’ensemble des classesd’homologues,
ensemblequotient
dugénotype général
par la relationd’équivalence qu’est
la relationd’homologie.
Lesymbole
d’une classed’homologues quelconque
sera C.Une classe
d’homologues
est un ensemble degènes homologues.
Deuxgènes appartenant
à une même classed’homologues
sonthomologues.
Autrement
dit,
toutgamète possède
pourchaque
classed’homologues
unreprésentant qui
est ungène appartenant
à cetteclasse d’homologues.
Chaque zygote possède
pourchaque
classed’homologues
deuxreprésen-
tants
qui
sont deuxgènes appartenant
à cette classed’homologues.
4. L’isoactivité des
gènes.
Deux
gènes
sont ditsisoactifs
ssi ilsappartiennent
à la même classe d’homo-logues
et ont une actionidentique
sur un même caractère. Deuxgènes
non isoactifs sonthétéroactifs,
notonsqu’ils peuvent
êtrehomologues
ou non.(5)
Nousremplacerons l’expression
« si et seulement si » par ssi.8 M. GILLOIS
Il
s’agit
encore d’une relation binaire dite relationd’isoaction,
de sym- bole Jequi
a lespropriétés
suivantes :Elle est réflexive : Elle est transitive :
Elle est
symétrique :
La relation d’isoaction génique
est une relationd’équivalence.
En consé-quence, elle assure une
partition
de l’ensemble desgènes
d’une même classed’homologues
en sous-ensemblesdisjoints
encore dénommés classesd’équi- valence,
classes degènes isoactifs.
C’est à ces classes degènes
isoactifs que lesgénéticiens
attribuent une nomenclature sous forme de lettres et d’abré- viations et dont ils se servent pour décrire lesgénotypes
individuels. Nous écrirons defaçon symbolique :
A,
ai, a2 ... ak étant les classes degènes
isoactifs. Nousappelons
sérieallélique
une suite de classes degènes
isoactifs. Les sous-classes degènes
isoactifs d’une même classe
d’homologues
sont allèles. Par extension deuxgènes homologues appartenant
à des classes degènes
isoactifs distinctessont allèles.
5. L’allélisme des
gènes.
Deux
gènes
sont allèles ssi d’une part ils sonthomologues
et d’autre part ils ont une actiondifférente
sur un même caractère.Cette relation n’est pas une relation
d’équivalence.
Elle n’est pas réflexive :
Elle n’est pas transitive :
Elle est
symétrique :
6. L’identité des
gènes.
Nous introduisons l’identité entre deux
gènes
par la définition suivante : Deuxgènes
sontidentiques
ssi ils dérivent par descendance mendélienne et sans mutation d’un mêmegène
ancêtre. Ils’agit
d’une relation binaire dusymbole
1qui possède
lespropriétés
suivantes : Elle est réflexive :Elle est transitive :
Elle est
symétrique :
La relation d’identité est donc une relation
d’équivalence.
Enconséquence,
elle réalise une
partition
de l’ensemble desgènes
dugénotype général
enclasses
disjointes
degènes identiques.
Si nous supposons que deux
gènes identiques
ont des effetsidentiques,
ilest immédiat que deux
gènes identiques
sontisoactifs,
mais laréciproque
n’est pas
vraie,
deuxgènes
isoactifs ne sont pas nécessairementidentiques.
Deux
gènes identiques
sonthomologues,
mais deuxgènes homologues
nesont pas nécessairement
identiques.
7. Le groupe de
linkage
ou groupe dedépendance.
Soit C l’ensemble des classes
d’homologues
dugénotype général
S.S étant un ensemble
fini, C
est un ensemble fini. Deux classesd’homologues appartiennent
au même groupe delinkage
ssi au cours de la méiose elles sontdépendantes
ou bien si elles sont chacunedépendantes
d’au moins une classed’homologues
d’un ensemble de classesd’homologues
appartenant au même groupe delinkage.
Ils’agit
d’une relationbinaire,
desymbole ~,
dont lespropriétés
sont les suivantes :Elle est réflexive : Elle est transitive :
Elle est
symétrique :
10 M. GILLOIS
La relation de
dépendance
est donc une relationd’équivalence.
En consé- quence, elle réalise unepartition
de l’ensemble C en sous-ensembles dis-joints Di appelés
groupe delinkage
ou groupe dedépendance, dont
l’ensemblea pour
symbole
3). Le nombre de groupes dedépendance D;
estpetit,
etl’expérience
montrequ’il
est fixe pourchaque espèce. Di
est ungroupe de dépendance,
ensemble de classesd’homologues
liées que noussymbolisons
par :
m étant le nombre maximum de classes
d’homologues
quecomprend
cegroupe de
dépendance.
Le
symbolisme
d’une classed’homologues
est :x e S étant un
gène, n
étant le nombre maximum degènes
de cette classed’homologues,
si lapopulation comporte
Nzygotes,
ce nombre est de 2 N.On
appelle
groupe dedépendance singulier
desymbole D*,
tout groupe dedépendance
réalisé dans ungamète.
Donc la connaissance dugénotype
individuel d’ungamète
définitD;
pour touti,
cequi
assure unedescription
correcte du
génotype
individuel de cegamète.
Par contre, la connaissance dugénotype
individuel d’unzygote permet
de décrire 2mD;,
m limitesupé-
rieure de
i, parmi lesquels
nous ne retiendrons commedescription
dugéno- type
individuel duzygote
que les deuxD; présents
dans lesgamètes
dont lafusion a créé ce
zygote.
Nousappelons
groupes dedépendance
homolo-gues
(6)
tous les groupessinguliers D;
pour i fixe. Ainsi toutzygote possède
2h groupes de
dépendance singuliers qui
serépartissent
en hpaires
degroupes de
dépendance singuliers homologues.
Ce sont dans
chaque
individu ces groupes dedépendance singuliers D;
que les
biologistes,
suivantDarlington,
associent aux chromosomespré-
sents dans cet individu.
Inversement,
un chromosome d’uneespèce
doitêtre associé à un groupe de
dépendance D~.
Cette différence essentielle entre lesconcepts analytiques
etsynthétiques qu’utilisent
lesgénéticiens
estrarement
soulignée.
Nous illustrerons cette remarque par un
exemple.
Considéronsquatre
individushaploïdes
w, x, y, zporteurs
chacun de deuxgènes.
Cesquatre
individus forment un groupe. Legénotype général
de ce groupe est la connais-(6)
Il s’agit d’unemploi
nouveau del’adjectif
«homologue »
dontl’usage
est accepté desgénéticiens.
sance des huit
gènes
que nousdistinguons
les uns des autres en les numé-rotant de 1 à 8. Les
renseignements biologiques
que nouspossédons
sontles suivants. Ils sont codifiés dans le tableau ci-dessous :
Nous aboutissons à la
partition
suivante :lre classe
d’Homologie, { 1, 3, 5, 7 }
danslaquelle
nous avons les trois sous-classesd’isoaction { (1,5) (3) (7) }.
2e classe
d’Homologie { (2, 4, 6, 8) }
danslaquelle
nous avons les deux sous-classesd’isoaction { (2, 4, 6) (8) }.
12 M. GILLOIS
Dans l’ensemble d’isoaction
(2, 4, 6)
nous avons unepartition
en 2 sous-ensembles d’identité
([2, 4] [6]).
Prenons comme
représentant
de lapremière
classed’homologie les
lettres A telles que :
[Al A2 As]
est une sérieallélique.
Prenons comme
représentant
de la seconde classed’homologie
les lettres B telles que :[Bi B2]
est une sérieallélique
d’où le schéma suivant desgénotypes singu-
fiers,
sachant que les classesd’homologues
sont liées :Si nous désirons résumer les
renseignements génétiques
recueillis pour le groupe d’individusW, X, Y, 2
nous construirons la cartegénétique
suivante : ’
8. La carte factorielle.
Soient
C;j
etCj’
EDi,
nouspostulons qu’il
existe une distance(’)
entreCü
et fonction
numérique
d(C~
à définie surDfl
telle que :Ces relations sont nécessaires et suffisantes pour
représenter
tout groupe dedépendance
sur unsegment
de droite orientée.Or d
(C;j
àpeut
êtreexpérimentalement
déterminée par la relation :p étant la
probabilité
de recombinaison entreCIl
etsi p
e; e étant unnombre réel
positif
etpetit.
Lesigne
est choisi arbitrairement pour un pre- miercouple
ordonné. Parapproche successive,
il estpossible
d’ordonnertous les
C;j
EDi.
Il est utile de définir dans
Di
un élémentCio E
Dappelé origine
tel quenous pourrons nommer carte
factorielle
ou drotiechromosomique
du groupe dedépendance Di
l’ensemble des distances d(Cio
àCu) Cio E Dl, ~Cij
EDi.
Le choix de
Cio
estarbitraire,
aussi choisissons-nousQo
en fonction ducritère suivant : «
l’origine
d’une droitechromosomique
est l’élément du1’)
Le substantif distance estemployé
dans son sens commun et non dans son sensmathématique,
synonyme demétrique.
14 M. GILLOIS
groupe de
dépendance qui
esttoujours préréduit
au cours d’uneméiose,
cetélément est dénommé
centromère,
sonsymbole
estC;o
».L’expérience
montre que cet élément est
unique.
Ainsi à toute classed’homologues C;j
ED; correspond
un seul nombre réel.9. Les attributs du
gène.
Dans le cadre d’une théorie de
génétique mathématique,
legène possède
trois attributs :
1. Son
action, simple
oumultiple.
Pour un seulcaractère,
cette actionse décrit par une
grandeur
mesurable.2. Sa
quasi-stabilité
de structure ou de nature àlaquelle
est attachéeune
probabilité
de mutation.3. Sa
quasi-stabilité
deposition (8).
Laposition
d’ungène
est déter-minée par sa distance au
centromère,
c’est un nombreréel,
celuiqui
estattaché à la classe
d’homologues
àlaquelle
ilappartient.
10. La notion de locus.
Nous devons formellement considérer le locus comme le
représentant
d’une classe
d’homologues,
mais l’évolutionhistorique
de lapensée géné- tique
en faitimplicitement
une forme amoindrie dugène,
ce que cache la fonction deréceptable
dugène
que l’on attribue au locus.Considérons un élément à
qui
serait attaché un nombre réel. Un tel élé- ment a les attributs d’unpoint
de la droite orientée. Lesgénéticiens appellent
un tel élément un locus
(pluriel loci)
desymbole
L. Il est immédiatqu’à
tout locus
Le
nous pouvons associer unClj,
c’est-à-direqu’à
un locus necorrespond qu’une
seule classed’homologues
d’un groupe dedépendance
et
réciproquement,
d’où l’écriture :Nous
ajouterons
comme attribut au locus que c’est un élémentqui
accom-pagne tout
gène, qui
est stable et seduplique
en même temps que legène
aucours de la méiose. Ce nouveau locus de définition
plus
riche estappelé
(8)
Nous supposerons par la suite que laposition
du gène est stable, éliminant de notre schéma desexemples
comme celui du gène bar de ladrosophile qui
pré-sente pourtant un gros intérêt dans le cas
d’épistasie.
locus
singulier (9).
En un locussingulier
nepeut
êtreprésent qu’un gène
d’uneclasse
d’homologues.
Deux loci
singuliers, auxquels
sont attachés les mêmes nombresréels,
sontdits
homologues
ssi ilsappartiennent
au même groupe dedépendance.
11. L’identité des loci.
Soit L l’ensemble des loci du
génotype général
S. En1948,
G. Malécota défini l’identité de deux loci : « Deux loci sont
identiques
ssi ils dérivent d’un même locus ancêtre par descendance mendélienne ». Ce même auteur a donné le moyen de calculer laprobabilité
d’identité de deux loci dans lecas des
populations à pedigrees
et despopulations panmictiques
d’effectiflimité. Cette relation d’identité de
symbole 3
est binaire etpossède
les pro-priétés
suivantes : Elle est réflexive : Elle est transitive :Elle est
symétrique :
Remarquons
que cespropriétés
ont été obtenues ensupposant
que le locus eststable,
c’est-à-dire que ses attributs ne sont passusceptibles
devariation,
enparticulier
le réel attaché à toutLij
estfixe, indépendant
desméioses ou - ce
qui
revient au même - du numéro degénération.
Autre-ment
dit, l’ordre
défini sur la droitechromosomique
nepeut
pas être modi- fié par la méiose. Nous excluons donc de notre schéma lesinversions,
lesduplications,
leséchanges réciproques
entre groupes dedépendance.
12. Généralisation de la notion de locus.
La notion de
locus,
telle que nous l’avonsintroduite, peut parfois
êtreinsuffisante. G.
Malécot,
en1948,
a été lepremier
àgénéraliser
cette notionlorsqu’il
écrit dans lesMathématiques
de l’hérédité(p. 9) :
«Supposons
(9) Dans la suite de notre exposé, et pour ne pas rompre avec
l’usage
courant fautif, nous dirons locus au lieu de locussingulier.
16 M. GILLOIS
maintenant que les loci considérés
puissent
être affectés par desmutations
defréquence
moyenne u pargénération.
Laprobabilité
pourqu’un
locusd’un individu
reproduise
sans modification le locusparental
dont il dériveest alors 1 - u ».
Aussi nous attachons au locus deux attributs : l’un la
position
définiepar
rapport
au centromère par un nombreréel,
l’autre la stabilité définie par l’absence ou non de mutation. Aussi dans tous les cas l’identité des loci entraîne-t-elle celle desgènes.
Nous définissons ainsi la mutation d’un locus : « Un locus mute ssi le
gène qui l’accompagne
mute. »La
probabilité
de cet événement estégale
à laprobabilité
moyenne de mutation d’ungène quelconque
de la classed’homologues correspondant
à ce locus. C’est cette définition
plus
riche du locus que nous utilisons dans l’étude despopulations
à loi de croisement.IV. - LES
DIFFÉRENTS
ASPECTS DE LA RELATIOND’IDENTITÉ
A la suite d’un cheminement
qui
va de 1941 à1948,
G. Malécot définit lecoefficient
deconsanguinité
comme laprobabilité
que deux loci homo-logues
d’unzygote
1 soientidentiques
par descendance mendélienne.Soit f
cette
probabilité.
Cet auteur étend la notion de coefficient deconsanguinité
par celle de
coefficient
deparenté qui
est laprobabilité
que deux loci homo-logues pris
auhasard,
l’unparmi
les deux locihomologues
d’unzygote I,
l’autre
parmi
les deux locihomologues
d’unzygote J,
soientidentiques
par descendance mendélienne.Nous nous proposons de
généraliser
ces notions par celle decoefficient
d’identité et d’utiliser ensuite ces nouveaux
concepts
introduits pour mieux décrire unepopulation
tant pour des caractères mendéliensqualitatifs
quequantitatifs.
- La
première étape
considère simultanément ngènes homologues
etnon
plus
deux.- La seconde
étape
estl’analyse
deplusieurs
classesd’homologues
distinctes telles que dans chacune d’elles le nombre des
gènes homologues
est
quelconque.
Une telle étudepermettra
d’étudier ladépendance
suscep- tible d’exister entre ces classes degènes homologues.
- La troisième
étape
passe du domainechromosomique
discontinu au domainechromosomique
continu. Pour cela nous considérons sur le chro-mosome des
segments
surlesquels
existe un nombrequelconque,
maisfixe,
de classes
d’homologues.
Le nombre dessegments chromosomiques
homo-logues
considéréspeut
êtrequelconque.
La dernièreétape
de notregénéra-
lisation a pour but de lever
l’hypothèse
restrictive desegments
fixés apriori.
Nous
rejoignons
en cepoint
les travaux que R. A. Fisherdéveloppe
dansThe
theory of inbreeding
de 1949.Les
différents
niveaux degénéralisation.
La transitivité de l’identité de deux
gènes
entraîne que n locihomologues peuvent
êtreidentiques
parcequ’ils
dérivent d’un mêmegène
ancêtre.Nous
prendrons
l’énoncé suivant comme définition de l’identité : « Desgènes homologues,
en nombrequelconque,
sontidentiques
ssi ils dérivent tousd’un même
gène
ancêtre ».La relation binaire d’identité 1 réalise une
partition
d’un ensemble Sde n
gènes (1°)
en sous-ensemblesdisjoints
degènes singuliers.
Deuxgènes pris
au hasard dans deux sous-ensembles distincts ne dérivent pas d’un ancêtre commun, donc iln’y
a aucune relation matérielle entre cesgènes,
nous dirons
qu’ils
sontindépendants (~).
La connaissance de la nature de l’un ne modifie pas la connaissance de la nature de l’autre. Deuxgènes pris
au hasard dans un même sous-ensemble sont
identiques
car ils sont tous lesdeux
copies
d’un même modèle : legène
ancêtre. La connaissance de lanature de l’un nous donne la nature de l’autre.
Tout sous-ensemble de
~, quel qu’il soit,
est unepartie
de nous ledésignons
par~.
Il y a 2nparties
de Squi
constituent un ensemble P. Nous pouvons décrire toutepartition
de l’ensemble S comme l’ensembledes 3j qui répondent
aux critères suivants :Toute
partition fixe
defaçon
totale les relations d’identité oud’indépen-
dance
qui
sontsusceptibles
d’exister entre lesgènes
de l’ensemble.Toute
partition
d’un ensemble 9 degènes homologues,
suivant la relation binaired’équivalence qu’est
la relation d’identité entre deuxgènes,
est par définition une situation d’identité restreinte. Touteprobabilité
attachée àune situation d’identité est un
coefficient
d’identité restreinte.Inversement, (1°)
Ces n gènes sont singuliers.(11) C’est une restriction importante que de supposer l’existence d’une double implication entre la non-identité et
l’indépendance.
ANN. INST. pomcARÉ, B-H-1 2
18 M. GILLOIS
une situation d’identité restreinte définie sur un ensemble S de n
gènes
homo-logues
est unepartition
de cet ensemble en sous-ensemblesdisjoints,
telsque deux
gènes quelconques pris
chacun dans l’un de deux sous-ensemblesquelconques
sonttoujours indépendants,
tels que tout sous-ensemble necompte qu’un gène
ouplusieurs gènes
tousidentiques
entre eux.Si {
xk, xi,~(1 ~ i,j, k, l, quand
l’ensemble 9compte
n
gènes homologues),
toute situation d’identité restreinte est de laforme : .
Deux cas limites sont à concevoir : celui pour
lequel
tous lesgènes
homo-logues
sontidentiques :
,et celui pour
lequel
tous lesgènes homologues
sontindépendants :
Pour un ensemble S de n
gènes homologues,
il existe un nombre x desituations d’identité restreinte tel que pour n =
2, x
=2; n = 3, x = 5;
~ == 4, ~ ===
15.Soit i un nombre entier tel que 1 ~ i ~ x, soit 6 le
symbole
d’une situa-tion d’identité. Nous pouvons
désigner chaque
situation d’identité res-treinte par
St. Pr { 6;}
est laprobabilité
attachée à la réalisation de la situation5~
d’où :Nous
généralisons
les situations d’identité restreinte de la manière sui- vante. Considérons deux ensembles nonhomologues
degènes homologues
tels que chacun
possède n gènes.
Ces deux ensemblespeuvent
avoir un nom- bre degènes
différents.Le
premier
ensemblepermet
de définir une série de x situations d’identité restreinte de la forme5~
et le second ensemblepermet
de définir une autresérie de x situations d’identité de la forme
2~.
Par définition nous
appelons
situation d’identitégénéralisée
la situation6~
==6~
()E5j.
Toute’
probabilité
attachée à une telle situation d’identitégénéralisée
estun
coefficient
d’identitégénéralisée.
Il est immédiat que :l’écriture
Pr { 6j ~/cond. C~i ayant
le sens suivant : «probabilité
de réalisa-tion de la situation d’identité restreinte
6j
sachant que la situation d’iden- tité restreinteC~l
a étéréalisée,
ils’agit
d’uneprobabilité
conditionnée ».Dans le cas où les deux ensembles de
gènes
seraientindépendants :
La
généralisation
à un nombrequelconque
d’ensembles distincts degènes singuliers
neprésente
pas dedifficulté,
toute situation d’identitégénéralisée
étant de la forme :
m
La
probabilité Par 1 fl 6fil )
estégale
à : .Le terme de rang m étant la
probabilité
conditionnée de la situation d’identité restreinte de l’ensemble desgènes homologues
de rang m, condi- tionnée par la réalisation des situations d’identité restreinte de rang inférieur à m. Si tous les ensembles degènes homologues
sontindépendants
deuxm
à
deux,
cetteexpression
dePr n 61
devient unproduit
de coefficient d’identité restreinte non conditionnée :Considérons le cas où tous ces ensembles de
gènes singuliers appartien-
nent au même groupe de
dépendance.
Parmi tous les ordrespossibles qui
rangent les ensembles de
gènes homologues
il en existe un dont les pro-20 M. GILLOIS
priétés
sontremarquables :
c’est celui de la droitechromosomique complète,
car les
gènes
serépartissent
à droite et àgauche d’une origine
lecentromère,
leur ordre étant le même que celui de leur distance au centromère. Toute carte factorielle
complète
est de la forme :avec : O O
Il
apparaît
utile d’attacher defaçon préférentielle
au centromère les situations d’identité restreinte que nous avonsprécédemment définies,
bienque cette
règle
ne soit pastoujours
laplus
efficace.Considérons comme
objets
entrelesquels
nous définissons une relation d’identité non pas desgènes, c’est-à-dire
despoints
de la droite chromo-somique,
mais dessegments
de cette droite.Deux
segments
sont ditshomologues
s’ilsappartiennent
au même groupe delinkage
et s’ils ont mêmes extrémités.Deux
segments
sontidentiques
si tous leursgènes
sontidentiques.
Un
segment chromosomique
n’est donc finalementqu’une
suite degènes.
Un
segment
est défini par les coordonnées de ses extrémitésqui peuvent
être fixées apriori
ou en fonction de diversparamètres.
Dans lepremier schéma,
lalongueur
dusegment
est une constante ; dans le secondschéma,
c’est une variable définie par sa fonction. Il est immédiat que les notions de situations d’identité et de coefficients d’identité
s’appliquent
auxsegments chromosomiques,
ainsi que lessymboles
utilisés. Nousappelons
situationd’identité
chromosomique fixe
toute situation d’identité décrite entre n seg- mentschromosomiques fixes,
et situation d’identitéchromosomique
variabletoute situation d’identité décrite entre n
segments chromosomiques
dont lesextrémités sont variables.
V. - LES SITUATIONS ET LES COEFFICIENTS
D’IDENTITÉ RESTREINTE
Nous avons,
jusqu’à présent,
considéré desgènes singuliers homologues
ou non, sans
jamais
définir leurappartenance
à une série degamètes
ou dezygotes.
Dans cechapitre
nous nous intéressons à des situations d’identitérestreinte
susceptibles
d’exister entre desgènes homologues répartis
dansun certain nombre de
zygotes.
Nousappelons
ordre d’une situation d’iden- tité restreinte ou d’un coefficient d’identité restreinte le nombre degènes homologues considérés,
et rang le nombre dezygotes
entrelesquels
se dis-tribuent ces
gènes.
Si l’ordre est n, et le rang m, nous avons la double iné-galité n 2
m n.Remarquons
que la limite inférieure de n est 2puisque,
pour
qu’il
y aitidentité,
il faut au moins deuxgènes homologues,
et que celle de m est 1.Soient n = 2 et m = 1. Nous considérons les deux
gènes homologues
d’un même
zygote,
et définissons les situations et les coefficients d’identité restreinte d’ordre2,
de rang 1.Soient n = 2 et m = 2. Nous considérons deux
gènes homologues
dontl’un est tiré au hasard
parmi
les deuxgènes homologues
d’unpremier zygote
et dont l’autre est tiré au hasardparmi
les deuxgènes homologues
du second
zygote.
Entre ces deuxgènes homologues
nous décrivons et nousdéfinissons des situations et des coefficients d’identité restreinte d’ordre
2,
de rang 2.
Soient n === 3 et m = 2. Nous considérons trois
gènes homologues
tirésau hasard
parmi
lesquatre gènes homologues
de deuxzygotes.
Autrementdit,
nous nous intéressons aux deuxgènes homologues
d’unzygote
et à ungène pris
au hasardparmi
les deuxgènes homologues
d’un secondzygote.
Entre ces trois
gènes homologues
nous décrivons et nous définissons des situations et des coefficients d’identité restreinte d’ordre3,
de rang 2.Soient n = 3 et m = 3. Nous considérons trois
gènes homologues
tirésau hasard chacun
parmi
les deuxgènes homologues
de l’un des troiszygotes
considérés. Nous décrivons et définissons entre ces troisgènes homologues
des situations et des coefficients d’identité restreinte d’ordre
3,
de rang 3.Soient n = 4 et m == 2. Nous considérons les
quatre gènes homologues appartenant
à deuxzygotes.
Nous décrivons et nous définissons entre cesquatre gènes homologues
des situations et des coefficients d’identité res-treinte d’ordre
4,
et de rang 2.Remarquons
que ce sont ces situations et cescoefficients d’identité restreinte
qui permettront l’expression
de la covarianceentre
apparentés quelconques.
Soient n = 4 et m = 3. Nous considérons
quatre gènes homologues
dontdeux
appartiennent
à unpremier zygote
et dont les deux autresgènes
sonttirés au hasard chacun
parmi
les deuxgènes homologues
de l’un des deux zygotes restant. Nous décrivons et nous définissons entre cesquatre gènes homologues
des situations et des coefficients d’identité restreinte d’ordre4,
de rang 3.
22 M. GILLOIS
Soient
n = 4 et m = 4. Nous considéronsquatre gènes homologues
chacun tiré au hasard
parmi
les deuxgènes homologues
de l’un desquatre zygotes.
Nous décrivons et définissons entre cesquatre gènes homologues
des situations et des coefficients d’identité restreinte d’ordre
4,
de rang 4.Nous
représentons
ungamète,
unspermatozoïde
ou unovule,
par les schémasci-dessous,
danslesquels
les groupes dedépendance singuliers
D* sont sous la forme d’un
segment
dedroite,
en yrepérant
le centromère C et ungène singulier
G.’
C’est d’une manière. similaire que nous schématisons un
zygote
1 enajou- tant,
commeconvention,
que tout élément non indicé par une étoile estd’origine paternelle
et quetout élément
indicé par une .étoile estd’origine
maternelle.
-Nous
symbolisons,
commeprécédemment,
par 6(s gothique majuscule)
les situations
d’identité;
par lesigne -
une relationd’identité;
par lesigne
oune relation
d’indépendance,
c’est-à-dire l’exclusion de la relationd’identité;
et par le