INTÉRÊT DE LA NUMÉRATION BINAIRE
DANS LES RECHERCHES GÉNÉALOGIQUES
J. LEFEBVRE
Statioya centrale de
Génétique
aniiiiale,Centre national de Recherches
zootechniques,
Jouy-en-Josas(Seine-et-Oise)
SOMMAIRE
L’étude, dans toute leur
complexité,
des liaisons entre lescaractéristiques
d’un animal et celles de l’ensemble de ses ascendants,exige
d’une partl’emploi
des méthodesstatistiques
à variablesmultiples.
Ceci est devenupossible grâce
à larapidité
et à lacapacité
des calculateurs actuellementdisponibles.
La nature binaire dulangage
interne de cesappareils
se révèle d’autre partparticu-
lièrement bien
adaptée
à la structure desgénéalogies.
La note présentequelques
remarques per- mettant desimplifier
et d’accélérer considérablement l’établissement et l’édition desgénéalogies,
ainsi que leur utilisation pour les calculs de
consanguinité.
Depuis près
d’unsiècle,
les animauxdomestiques
ont faitl’objet
d’améliorationsremarquables, qu’il s’agisse
de leur conformation ou deperformances
aussi diffé- rentes que la vitesse des chevaux de course ou laproduction
des vaches laitières.Les
origines
des races actuellement lesplus répandues
dans le monde sontgénéralement
bien connues et elles se limitent à un trèspetit
nombre dereproduc-
teurs
exceptionnels, remarqués
et utilisés efficacement par un nombreégalement
réduit de sélectionneurs. Le ralentissement du
rythme
desprogrès génétiques depuis quelques décennies,
les échecs rencontrésparfois
lors de latransposition
à l’échellede
populations nombreuses,
inséminéesartificiellement,
de méthodesqui
s’étaientrévélées efficaces au stade
d’élevages
limités ethomogènes
méritentqu’on
appro- fondisse les raisons de cette situation. Pour enjuger valablement,
il est nécessaire derechercher,
dans toute leurcomplexité,
les relationsqui peuvent
exister entrecaractéristiques
d’ascendants et de descendants.Jusqu’à présent,
les études ont été limitées aux éléments de deuxgénérations
successives.
Or,
un sélectionneur n’ajamais
choisi unreproducteur uniquement
enfonction des
productions
de sa mère parexemple,
ou même desproduits déjà
connusde son
père.
Ilprend
enconsidération,
d’une manière trèsintuitive,
les défauts etqualités
de ses ascendants etcollatéraux,
sur de nombreusesgénérations.
Pour
qu’une
tellesynthèse
devienne moinsempirique
et ne reste pas le fait dequelques
personnes douées de dons d’observation et d’une mémoireexceptionnels,
deux
problèmes
doivent être résolus :pouvoir
manierrapidement
desgénéalogies comportant
ungrand
nombre degénérations,
étudier defaçon systématique
lesrelations entre les
caractéristiques
deproduction
dessujets
constituant cesgénéa- logies.
Les calculateurs
actuels,
par leurrapidité
et leurcapacité, permettent
d’utiliser les méthodesstatistiques
à variablesmultiples, indispensables
pourl’analyse
simul-tanée de ces liaisons. De
plus
leur mode de calcul binaire est bienadapté
à l’établisse-ment des
généalogies.
Considérons en effet lesystème
denumérotage
des ascendantsqui
a étéproposé
àplusieurs reprises,
mais dontl’emploi
ne s’est pasgénéralisé,
car ses
avantages
sont très limités dans le cas d’un traitement manuel(tabl. i).
Sous cette forme
décimale,
on voit immédiatement que les numéros de range- ment des « têtes degénérations
», 1,2 , 4 , 8,
r6 ...peuvent s’exprimer
enpuissances
successives de 2 :
2 °,
212 2 , 2 3 , 2 4 ,...,
dont lesexposants
sontjustement
les numérosd’ordre des
générations.
Tous les numéros des éléments d’une mêmegénération
contiennent la même
puissance
de 2. Ladistance, exprimée
en nombre degénérations, qui sépare
deux éléments de lagénéalogie,
etqui
est utilisée dans les calculs deparenté
et de
consanguinité,
est donc donnée directement par la différence entre lespuis-
sances de 2 contenues dans les numéros de ces deux éléments.
Si nous
traduisons,
comme le calculateur dans sonlangage interne,
ces numérosen
binaire,
nous obtenons le schéma du tableau n° 2.Nous pouvons, sur ce nouveau
schéma,
faire les remarques suivantes :1
° Le nombre de
chiffres,
moins un, du numéro d’ordre d’un antécédent estégal
au numéro d’ordre de sa
génération.
La division par 2 en numération décimale est doncremplacée
en binaire par la détermination de laposition
du dernier chiffre degauche, opération
4 à 5 foisplus rapide.
2
° Le dernier chiffre du numéro d’ordre d’un ascendant donne immédiatement
son sexe : o pour les
mâles,
i pour les femelles. La recherche de laparité
ou del’impa- rité,
succession de 2,5comparaisons
en moyenne, estremplacée
par lacomparaison
d’une seule
position binaire,
2 à 3 foisplus rapide.
3
°
Les numéros de tous les ascendants d’un animal commencent tous par le numéro de cet animal.4
° Tous les numéros des éléments de la
lignée
mâle commencent par io, tous ceux de lalignée
femelle par m.La constitution d’une
généalogie
est uneopération simple :
si l’ondispose,
pourchaque
individu d’unepopulation donnée,
d’un élément(carte perforée
parexemple), où,
à sonindicatif, (numéro d’inscription,
nom à conditionqu’il
soitunique...),
sontassociés ceux de ses
parents,
on «enregistre
» sur l’une des mémoires du calculateurces
éléments,
triés pour accélérer lesopérations
ultérieures. Sur une secondemémoire,
on range, en les numérotant
respectivement
1, 2, 3, l’indicatif de l’individu dont on désire lagénéalogie
et ceux de sesparents.
La recherche de l’indicatif dupère
dansla
première mémoire,
donne les indicatifs desgrands-parents paternels
que l’on rangedans la seconde mémoire en les numérotant 4 et 5. On
opère
de même pour lesgrands-parents
maternels et,successivement,
pour les éléments desgénérations
successives. I,a
généalogie
est doncconstituée,
par colonnessuccessives,
enajoutant
à
chaque
indicatif(immuable
etcaractéristique
dechaque individu),
un(ou plusieurs)
numéros
d’ordre,
propres à lagénéalogie constituée,
etqui
y fixent son(ou ses) emplacements.
Mais lagénéalogie
constituée dans la seconde mémoire necomporte
pas de « blanc
» (dans
le cas d’antécédentsinconnus,
cequi
arrivefréquemment lorsque
le nombre desgénérations
estélevé) :
tous les antécédents sontrangés
à lasuite les uns des autres, leur
place
dans lagénéalogie
étant donnée par leur numéro d’ordre et non par leuremplacement
dans la mémoire.Le ’nombre d’éléments d’une
généalogie
croîtrapidement
avec le nombre degénérations (tabl.°3).
Si la constitution d’une
généalogie
estsimple,
elle est donctoujours
relativementlongue
au-delà de 4 ou de 5générations.
Salongueur dépend également
del’impor-
tance de la
population
de base.Il y a donc intérêt à
pouvoir reprendre
directement les ascendancesdéjà
cons-tituées,
pour les animauxqui
se retrouventfréquemment.
Cette réutilisation revient à unchangement
des numéros d’ordre. Cechangement, qui n’apparaît guère possible
en numération
décimale,
se résume par contre à unesimple
substitution despremiers
chiffres en numération binaire.
Prenons,
parexemple,
l’antécédent 100dans le tableau 2 et supposons que nous leretrouvions,
dans la mêmegénéalogie,
ou dans une autre, en 110. Ses propres ascendants dans lapremière généalogie (tabl. 4 )
doivent devenir pour 110 ceux dutableau n° 5.
On voit immédiatement que le passage d’un tableau à l’autre
revient,
danschaque
numérod’ordre,
àremplacer
les 3premiers
chiffres zoo par 110.Si le transfert doit s’effectuer d’une
génération
à unesupérieure, l’opération
esttrès semblable. Si par
exemple,
100 se retrouve en i 100, il suffira deremplacer
les3
premiers
chiffres(ioo)
dechaque
numéro d’ordre par i ma.Un cas
particulier
intéressant de transfert à unegénération
d’ordre inférieur est fourni par la mise enréserve,
sur cartes parexemple,
de lagénéalogie
d’un animalque l’on pense rencontrer souvent dans les recherches
généalogiques
conduites surune
population
déterminée. Il est naturel de lui affecter le numéro i pour cestockage.
Si l’on veut conserver
l’origine
du 111, on substituerasimplement
i aux 3premiers
chiffres de
chaque antécédent, qui
sonttoujours
m.Les
gains
detemps
réalisablesgrâce
aux remarquesprécédentes, dépendent
étroitement des calculateurs et de la nature des mémoires de
stockage. Mais, quels qu’ils soient,
les transfertsindiqués
avec unsimple changement
dequelques
chiffresdu numéro
d’ordre,
sontbeaucoup plus rapides
que le mode derecherche,
àpartir
de la
population
debase,
des ascendants.La numérotation binaire
accélère,
en secondlieu,
l’édition desgénéalogies.
laprésentation
verticale « enarbre »,
habituelle auxgénéalogistes,
ou celle « horizontale » couramment utilisée enzootecbnie,
avec des flèches ou accolades reliantchaque
animal à ses deux
parents, peuvent
difficilement êtreenvisagées
avec les c< sorties »dont les calculateurs
disposent généralement.
Par contre, unelégère
modification de laprésentation
« horizontale » conduit à une solutioncompatible
avecl’organisation
du matériel existant. Elle consiste à sortir sur la
première ligne
la succession des têtes degénérations
et dans la dernièrecolonne,
les éléments successifs de la dernièregénération. Chaque ligne
est alors constituée de droite àgauche,
àpartir
des élé-ments de cette
colonne,
en divisant par 2 leur numéro d’ordrejusqu’à
obtenir unnombre impair,
cequi
enbinaire,
revient àsupprimer,
dans le numérod’ordre,
le chiffre de droitejusqu’à
cequ’il
soit i(tabl. 6).
La numération binaire entraîne
également
degrandes simplifications
dans lescalculs de
parenté
et deconsanguinité.
Ces calculs commencent par la recherche de laprésence
simultanée d’un même antécédent dans lesorigines
de 2individus,
lesparents
dans le cas deconsanguinité.
La
première
remarque donne immédiatement la « distance» engénérations.
La deuxième remarque, sur le sexe,
permet
de réduire de moitié le nombre decomparaisons
sur lesindicatifs,
en effectuant aupréalable
unecomparaison
sur ladernière
position
du numéro binaire seulement. I )ans le cas d’indicatifs de 10chiffres,
letemps
de recherche est réduit de 4o p. roo.La troisième remarque
permet,
dèsqu’un
animal a été trouvé simultanément dans leslignées
mâle etfemelle,
degarder
mémoire(sous
forme du numéro de sesdeux
positions)
de la « voie nempruntée
afin de neplus
l’utiliser ultérieurement. Ceproblème
ne semble pas avoir été résolu en numération décimale.La
quatrième
remarquepermet, partant
d’un antécédent de laligne
10, d’évitertoute autre
comparaison
d’indicatif dans cettelignée,
par unecomparaison préalable
à 10 des 2
premiers
chiffres du numéro d’ordre. La réduction totale detemps
passe à 55 p. 100.Il est
probable
que d’autrespropriétés
de la numération binaire seraient suscep- tibles de faciliter encoredavantage
les recherchesgénéalogiques
sur calculateur élec-tronique.
Mais dès àprésent,
il nous a paru utiled’indiquer
cellesqui
nous ontpermis
d’aborder certaines études que nous
comptons développer prochainement.
Reyts pour
pi4l)li(-alioii
en mai i96!.SUMMARY
ADVANTAGE OF THE 13INARY NUMERATION IN PEDIGREE RESEARCHES
1’he study of the very