Utilisation de la numérotation binaire pour le calcul de la consanguinité

(1)

HAL Id: hal-02727507

https://hal.inrae.fr/hal-02727507

Submitted on 2 Jun 2020

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Utilisation de la numérotation binaire pour le calcul de la consanguinité

Jacques Lefebvre

To cite this version:

Jacques Lefebvre. Utilisation de la numérotation binaire pour le calcul de la consanguinité. Genetics Selection Evolution, BioMed Central, 1981, 13 (4), pp.447-458. �hal-02727507�

(2)

Note

Utilisation de la numérotation binaire pour le calcul de la

consanguinité

J. LEFEBVRE

LN.R.A., Laboratoire de Génétique factorielle Centre de Recherches zootechniques

F - 78350 Jouy-en-Josas

Résumé

La numération binaire des positions ^des^ancêtres^dans^unegénéalogie permet ^de réduire considérablement la place nécessaire en mémoire _pourles calculs de consanguinité

sur ordinateur. Elle a été utilisée _pourréaliser sur micro-ordinateur un programme prenant

en considération jusqu’à ¹⁶générations. ^Sasimplicité ^et^sonfaible coût de mise en oeuvre

rendent possibles ^delongues séries de calculs.

Les programmes de calcul de consanguinité publiés jusqu’à présent ^demandent

des capacités ^en^mémoire^et^destemps d’exécution, ^doncentraînent des coûts,

limitant sévèrement leurs applications (HAZEL ^& LusH, 1950 ; PLUM, 1952, 1954 ;

R

EHFELD et RL, 1967 ; ^A^LFO^rrsoPONCE, 1971, 1974 ; LowE, 1972 ; FALCO, 1975 ; R

O S TR O N

, 1978).

Nous avons indiqué précédemment (LEFEBVRE, 1965) ^{l’intérêt}^de^lanumérotation binaire dans la constitution des généalogies ^mais^cette^voie^nesemble pas avoir été reprise par d’autres auteurs. De notre côté, ^nous^n’avonspas ^eula possibilité, jusqu’à

ces dernières années, d’utiliser un ordinateur où la manipulation ^de^cette^numération

soit réalisable.

Avec l’arrivée ^en1976 d’un micro-ordinateur WANG 2200 la situation a été modifiée mais la mémoire, ^de^{4 K}puis ^de⁸K, ^étaittrop restreinte _pourenvisager

des exploitations ^{sur un}nombre suffisant de générations.

Lorsque, disposant ^d’une^mémoire^{de 16 K}^et^deplus ^detemps ^demachine,

nous avons voulu étudier les instructions binaires nous n’avons trouvé, ^{dans le}

(3)

chapitre de la brochure consacré par le constructeur à cet aspect, que des indications brèves et hermétiques ^alorsque les autres parties étaient, pour ^cegenre de littérature,

inhabituellement claires et logiques.

Un premier programme ^aalors été réalisé en faisant correspondre ^au^numéro

de position ^dechaque âncêtreûnnombre, composé ^de⁰êt^de1, qui ^soit^sonéqui-

valent binaire. Les nombres, ^sur^la2200, ^étant^limités^à¹³chiffres, ^il^n’étaitpas

possible théoriquement ^dedépasser ^{la 13}^e génération. ^Enpratique, ^laplace occupée

par ^cettetraduction (8 ^octetspar position d’ancêtre) permettait ^toutjuste d’atteindre 9 générations. ^Lesconversions étaient d’autre part relativement longues ^et,^comme

elles étaient très nombreuses, ^lestemps d’exploitation pouvaient convenir pour des tests mais excluaient tous calculs en grande ^série^au-delà^{de 5-6}générations.

Une méthode générale ^de^calcul^deconsanguinité ^basée^sur^lanumérotation binaire ^acependant pu être ainsi mise au point. Pour réduire les temps ^decalcul,

elle a été transposée, toujours ^enBASIC, ^surl’LB.M. 370 du C.I.R.C.E. Evidemment

beaucoup plus rapides ^lesexploitations ^ont^étérapidement limitées par les prix

de revient.

Les possibilités du binaire de la 2200 ont alors été à nouveau explorées ^{et ont}

conduit à un programme général, âllantjusqu’à ¹⁶générations, êtdonnant des temps d’exploitation ^trèsacceptables âvec^descoûts extrêmement réduits.

La numérotation binaire des généalogies ^et^satraduction en mémoire

La numérotation décimale des positions ^des^individus^d’unegénéalogie ^et^son équivalent ^binaire^sont^donnésdans le tableau 1, pour 6 générations. ^{Le mode}^de

codification _pourles générations ^suivantesêstévident. Le numéro de génération correspond âu^{nombre de}chiffres de la position ên^binaire.

Or, ^dansle 2200 comme dans la plupart ^desordinateurs, ^lespositions ^binaires

vont par ^{octet :}deux octets suffisent donc _pourmémoriser la position ^de^tout ancêtre jusqu’à ^la^16’génération.

Comme nous disposions ^deplusieurs ^milliers^degénéalogies ^sur¹⁰générations

et que les essais précédemment évoqués avaient montré _quele taux de consanguinité pouvait ^croître^defaçon ^nonnégligeable ^{de la}7&dquo; à la 9’, ^lasolution d’un seul octet n’a pu être ^retenue.^En^cas^debesoin, l’extension à 3 octets, soit 24 générations,

ne pose ^aucunproblème mais l’information nécessaire est rare et coûteuse à réunir.

Le principe ^ducalcul de la consanguinité ^estsimple. ^Mais^enpratique, ^dès^que

le nombre des individus qui ^seretrouvent plus d’une fois dans l’origine dépasse quelques unités, que leurs positions ^semultiplient ^ets’éloignent, il n’est pas aisé, ^aussi

bien en calcul manuel qu’en ordinateur :

- d’éliminer systématiquement ^tousles individus qui ^se^trouvent^derrière^un

ascendant déjà pris ^enconsidération,

- de tenir compte ^{de la}consanguinité ^laplus élevée d’un tel ascendant.

(4)

Pour respecter ^lapremière condition la solution binaire est simple : ^tous^les

ascendants d’un individu ont un numéro binaire de position commençant par le numéro de cet individu. Il est facile de le vérifier sur le tableau 1 : tous les ascendants de la GMP ont un numéro commençant par 101, ^tous^ceuxde la mère débutent par 11, ^etc.

(5)

Recherche de toutes les voies pouvant apporter ^{de la}consanguinité

Tous les cas possibles ^deconsanguinité sont tout d’abord détectés en prenant les individus par numéro décroissant de génération (et évidemment _parsexe : 0 pour les mâles, 1 pour les femelles dans le dernier chiffre binaire du numéro de position).

La numérotation binaire donne facilement la position ^de^l’ancêtrequi reçoit ^une consanguinité d’un même individu situé en deux positions antérienres : son numéro

est composé ^despremiers ^chiffres^communs^de^ces^deuxpositions.

Si _parexemple le même animal est en 100000 et 100010, il apportera ^de^la consanguinité ^à^laposition 1000. S&dquo;il est en 100011 et 10101, ^laposition ¹⁰(le père)

sera concernée. Les positions ¹⁰¹⁰⁰⁰^et¹¹¹¹⁰⁰n’influent _quesur 1...

La détection de ces chiffres binaires communs se fait par des décalages, ^extrê-

mement rapides ^enbinaire. Prenons le deuxième exemple. ^Nous^{avons en}^{mémoire :}

Après cadrage ^àgauche ^lesmémoires contiennent :

Une comparaison ^booléenne^met^{des 0}^dans^lespositions semblables et des 1 dans celles qui diffèrent. La mémoire de gauche ^devient^{alors :}

Ayant ajouté ^deuxautres octets à gauche, ^il ^estalors facile d’y ^faireapparaître

la partie ^commune^en^cadrant^à^nouveau^àgauche ^{le 3’}^{octet :}

et en opérant ^desdécalages simultanés sur la mémoire de droite :

Les deux premiers ^octetsde la seconde mémoire contiennent le numéro de

position ^du^«^receveur(ici ^{10 :}^lepère).

La valeur de la consanguinité ^reçue^est^déduiteimmédiatement du nombre des 3 séries de décalages qui ^nedépendent que des numéros de génération ^du^receveur^et

des deux « donneurs ».

(6)

Pour chaque ^valeur^deconsanguinité ^trouvée^onrange ^enmémoire sur 12 octets : - le numéro binaire du receveur ... 2 octets

- les numéros des 2 positions du donneur ... 4 octets

- la valeur de cette consanguinité, ^en^format^.xxxxx... 6 octets

Elimination des voies déjà prises

La suppression ^desconsanguinités apportées par des ancêtres ^se^trouvantderrière deux ascendants déjà pris êncompte s’opère par groupe de voies aboutissant âu même receveur. L’ensemble des receveurs ayant été triés sur leur numéro de position (2 octets) l’opération êst^faiteséquentiellement.

Si ûn_groupene contient qu’une ^{voie elle}êstâussitôtimprimée. ^S’ilêncomporte plusieurs, ^la^l’°êstcomparée systématiquement ^à^toutes^lesâutres^dugroupe, pour l’éliminer si ses 3’ et 4&dquo; octets d’une part, ^ses^5°êt6’ d’autre part commencent par les mêmes chiffres binaires _queles octets correspondants d’une voie suivante.

En reprenant ^lepremier schéma, supposons que le même individu se trouve en

position ¹¹¹(GMM) êt1101. _{Il y}aura évidemment identité d’indicatif en 1110 et 11010, ¹¹¹¹êt^11011...D’après ^notreôrdre^de^tri^nousrencontrons en tête de groupe :

et en queue

Les 3e et 4e octets d’une part, ^les⁵ê êt⁶ê^d’autrepart commencent bien par les mêmes chiffres binaires, respectivement ¹¹⁰¹êt^111.La 1&dquo; voie doit donc être éliminée. On utilise alors une démarche très semblable à celle utilisée précédemment.

Les octets 3 et 4 sont transférés à droite de la mémoire auxiliaire à 4 octets :

et :

puis ^lecadrage ^àgauche du 3&dquo; octet est opéré :

et :

(7)

Du nombre le plus grand ^dedécalages ^ondéduit la longueur ^{du numéro}^deposition

le plus ^faible⁽⁴^{dans le}^casprésent).

En faisant de nouveaux décalages ^de^cettelongueur ^dans^{les deux}^mémoires apparaissent, dans les deux premiers ^octets,^lesparties ^{dont il}n’y ^aplus qu’à ^tester

l’éventuelle égalité :

S’il y âinégalité, ^{la voie}êstconservée. Sinon on opère ^{de même}^sur^{les 5}ê êt^6’^{octets :}

Après transfert dans les 2 mémoires auxiliaires de 4 octets et décalages ^nous^{obtenons :}

et :

puis :

et :

S’il _y^aégalité dans les deux premiers ^octets(comme ^{dans le}^casprésent), ^la

voie est éliminée. Sinon elle est comparée ^{de la}^mêmefaçon ^à^toutes^les^autres^du

groupe.

On opère ainsi pour ^toutesles voies du groupe êtônédite les consanguinités qui subsistent ênles triant :

- par indicatif d’individu donneur, ^carles effets de la consanguinité peuvent être très différents selon qu’elle provient ^{de tel}^ou^telreproducteur ;

- par nombre croissant de générations prises êncompte. Êneffet, si le nombre d’ancêtres double à chaque génération, le nombre de voies croît généralement beaucoup plus vite. Pour une population donnée, ônpeut âinsidéterminer la limite au-delà de laquelle ^lecomplément d’information devient très faible par rapport ^à

son coût.

La même démarche est reprise pour les groupes successifs, c’est-à-dire par ordre décroissant de numéro de générations ^du^receveur.

(8)

Pour chaque îndicatifd’ascendant, la valeur maximum de consanguinité reçue est mise à jour âu^furêt^à^mesure.

Amélioration de la capacité ^et^de^la^vitessed’exploitation

Comme nous l’avons signalé, la limite de 16 générations peut ^êtreportée ^à²⁴

et même au-delà par tranche de 8. Le facteur limitant est essentiellement le nombre de voies possibles. ^Pourpallier ^cetinconvénient ne sont mémorisées _{que les}consan-

guinités ^au^moinségales ^à10-5, plusieurs ^testsayant ^montréque les résultats finaux sont pratiquement inchangés.

Des gains sensibles de temps êt^deplace ^sontôbtenusênn’introduisant _queles ancêtres figurant âu^moins2 fois dans l’ascendance. Le seul inconvénient est de ne

pas avoir ênfin de calcul les indicatifs des autres ancêtres qui ôntâussireçu de la consanguinité. Ces indicatifs peuvent cependant être retrouvés avec les numéros de position.

Les problèmes ^deprogrammation

Les difficultés de mise au point ^sont^venues^dufait que, ^surla 2200, ^nepeuvent être affichés _{que les}équivalents ^enhexadécimal des nombres binaires. De nombreux transcodages ^manuels^ontété nécessaires.

Les positions binaires, ^d’autrepart, ^nepeuvent ^êtremanipulées que par groupe de 8 ^-un octet ^-et la recherche, parmi ^lavingtaine d’opérations logiques disponibles,

de celles permettant âumieux les décalages, extractions et comparaisons ^décrites précédemment, ^n’estpas immédiate. Mais, êndéfinitive, ^lesgains ^de^vitesseêt^de capacité de traitement sont spectaculaires.

Application ^{au cas}classique ^de^COMET

L’origine ^de^ce^taureau^fameux^estgénéralement ^fournie^sur⁶générations ^dans

la littérature (CRAPLET, 1963, p. 188).

Les ancêtres communs et leurs positions, ^telsqu’ils ^sontintroduits dans la 1 rc partie

du programme, ^sontdonnés dans le tableau 2.

La généalogie peut ^être imprimée, ^avecles numéros décimaux de position (tableau 3).

Sur les 29 voies possibles ^deconsanguinité, ²⁰^sontéliminées. Les 9 autres sont classées _{par ordre}décroissant de génération (tableau 4).

(9)

(10)

(11)

Intérêt des exploitations ^surmicro-ordinateurs

Les calculs de consanguinité, ^même^avec^desengins puissants, ^sont^desopé-

rations longues : ^leurprix ^faitbeaucoup plus ^que^doublergénéralement lorsqu’une génération supplémentaire êstprise ênconsidération. Il est trop ^souventâdmisâpriori qu’au-delà ^{de 5}ôu⁶générations ^lesupplément d’information est négligeable. Ôr

l’étude de 1 660 taureaux Normands testés a montré d’une part que la consanguinité augmente ^souvent^defaçon ^netteau-delà de la 7’ génération ^et,^d’autrepart, que de très faibles différences de taux de parenté, ^de^l’ordrede 2 p. 100, pouvaient

entraîner des effets importants (LEFEBVRE et al., 1981).

Pour pouvoir ^tenircompte du maximum d’information disponible ^sur^lesorigines

il est donc indispensable ^derechercher les moyens de traitement les plus économiques.

Les très grands ordinateurs sont certainement les plus efficaces pour établir de

longues généalogies ^àpartir ^de^grosfichiers d’état civil et extraire, ^de^chacune d’elles, ^{la liste}^desâncêtresqui s’y ^trouventâumoins deux fois, âvecleurs numéros de position. Mais le calcul proprement ^{dit des}consanguinités êt^desparentés êst,âvec

le système exposé, beaucoup plus économique ^surmicro-ordinateur car, s’il est 5 à 10 fois plus long, ^leprix ^de^l’unité^detemps y ^estextrêmement moins élevé.

Les connexions entre les 2 catégories ^de^matériel^étant^désormaissimples ^et^très abordables, de telles solutions d’exploitation ^mixte^sedévelopperont rapidement.

Reçu pour publication ^enoctobre 1981.

Summary

Use of binary numeration for calculation of inbreeding

Binary numeration of the positions of ancestors in a pedigree considerably ^reduces the _spaceneeded in _memorybanks for computer calculation of inbreeding. ^It^was^used

to design ^aprogram for microcomputer ^whichtakes into account up to 16 generations.

Its simplicity ^{and low}^cost^ofimplementation ^makepossible long series of calculations.

Références bibliographiques

A LFO

tvso PONCE P., 1971. Redes genealogicas y computacion ^decoeficientes de parentesco y consanguinidad. ^Arch.Zootech., 20, ^257-299.

A LFONSO

PONCE P., 1974. Computacion de coeficientes de consanguinidad y de parentesco.

1&dquo;

r Congrès mondial de Génétique appliquée ^àl’élevage, 2, ^449-457.

C

RAPLET C., ^1953.Génétique ^etélevage. Vigot Frères, Paris, ²⁹²p.

C

RUDEN D., 1949. Computation ^ofinbreeding coefficients for closed populations. ^J.Hered., 40, ^248-251.

(12)

E

MIK D., ^TERRILC.E., ^1949.Systematic procedures ^forcalculating inbreeding coefficients.

J. Hered., 40, ^51-55.

F

ALCO M.J., ^1975.The calculation of inbreeding coefficients. Biometrics, 31, ^993.

H

AZEL L.N., ^LusHJ.L., ^1950.Computing inbreeding ^andrelationships coefficients from punched cards. J. Hered., 41, ^301-306.

K

OWNACKI M., 1963. Méthodes simplifiées du calcul des coefficients d’inbreeding ^et^de

la consanguinité (en polonais). Przegl. Hodowl., 31, ^33-34.

K

RAVCHENKO N.A., ^M^AYBORODA N.N., 1968. On the methods for calculation of inbreeding coefficients and genetic affinity (en russe, rés. angl.). ^Tsitol.Genet., 2, ^104-118.

L

EFEBVRE J., 1965. Intérêt de la numération binaire dans les recherches généalogiques.

Ann. Zootech., 14, ^299-305.

LEFEBVRE J., ^HAMONMarie-Claire, ^CALLENSV., WIMITZKY M. Parentés entre 28 taureaux Normands tête de lignée ^etdistances entre les _groupesde leurs 669 fils testés (en

cours de publication).

’LowE P.C., ^{1972. A}computer program for calculating inbreeding coefficients in Dioecious populations. ^U.S.D.A.(Miscellaneous publ., ^{n° 1}220), ¹⁸p.

PLUM M.D., 1952. The computation ^ofinbreeding ^andrelationship coefficients in populations

with a relatively small number of different males ancestors. J. anim. Sci., 11, ^742.

P LU

M M.D., ^1954.Computation ^ofinbreeding ^andrelationship coefficients. J. Hered., 45, ^92.

REH

FELD C.E., ^B^ACUS J.W., ^PAGELSJ., ^D^IPERT M.H., ^1967.Computer calculation of

Wright’s inbreeding coefficient. J. Hered., 58, ^81-84.

R

OSTRON J., 1978. On the computation ^ofinbreeding coefficients. Ann. Yium. GeneT. t,ond., 41, ^469-475.

W

RIGHT S., 1949. Coefficients of inbreeding ^andrelationship. ^Am.Nat., 56, ^330-338.