Méthodes mathématiques pour l'étude des gènes contrôlant des caractères quantitatifs

(1)

Article

_original

Méthodes

_{mathématiques}

pour

l’étude des

gènes

contrôlant

des caractères

_quantitatifs

B

Goffinet

J

_Beckmann,

D

_Boichard,

M

_Causse,

A

Charcosset,

C

_Chevalet,

C

Christophe,

JJ

_Colleau,

F

_Demenais,

CE

_Durel,

JM

_Elsen,

JL

_Foulley,

A

_Gallais,

KU

_Götz,

F

_Hospital,

A

_Kremer,

M

_Lorieux,

M

_{Lefort-Buson,}

P

Le

_Roy,

P

_Loisel,

B

_Mangin,

A

_Maurice,

X

_Perrier,

O

_Pons,

A

_Rebaï,

F

_Rodolphe,

M

San

_Cristobal,

J Vu

Tien

_Khang

(groupe MMM)

1 Institut

national de la recherche

_agronomique,

station de biométrie et

_{intelligence artificielle,}

Chemin de

Borde-Rouge, Auzeville,

BP 27, 31326 Castanet-Tolosan

Cedex,

France

Résumé - Nous

présentons

ici les travaux s’inscrivant dans le cadre du

projet

«Mathéma-tiques

et marqueurs

moléculaires»,

en

_abrégé

«MMM». Ces travaux ont pour

objet

l’iden-tification et l’utilisation de

gènes

contrôlant des caractères

quantitatifs -

ou

_QTL

(quan-titative trait

_{loci) -}

à

_partir

de l’information issue des

_phénotypes,

de la

_généalogie

et de

marqueurs moléculaires. Une

première

partie concerne la mise en évidence de

_gènes

à effet

majeur

et l’utilisation de ces

_gènes

en

_sélection,

à

_partir

d’informations

phénotypiques

(mesures

sur le caractère dont le contrôle

_génétique

est

_recherché)

et

_{généalogiques}

(rela-tions de

_parenté

entre individus de la

_population

_mesurée).

La deuxième

_partie

concerne

l’utilisation

_conjointe

de ces informations

phénotypiques

et

_{généalogiques}

avec celles

is-sues du marquage moléculaire dans la

détection,

la localisation de

QTL,

et en amélioration

génétique.

cartographie

/

gène majeur

/

marqueur moléculaire

/

maximum de vraisemblance

/

locus de caractère _quantitatif

Summary - Mathematical methods for _studyinggenes controlling quantitative traits. We _presentin this paper the results

of

the

_project

"Mathematics and Molecular Markers" "

(MMM).

These results concern the

_{identification}

and use

_{of genes}

that control _quantitative

characters or

QTL

(quantitative

trait

_loci),

using

phenotypic, genealogical

and molecular marker

_information.

The

_first

section concerns

identification of major

_genes_using

(2)

individuals)

type and use

of

these _{genes in}selection. The second section concerns the use

_of

this

_information

_jointly

with molecular marker

_{information for}

detection and localisation

of QTL,

and

for genetic

improvement.

mapping

/

major gene

/

molecular marker

/

maximum likelihood

/

quantitative trait locus

INTRODUCTION

L’ensemble des travaux s’inscrivant dans le cadre du

_projet

«MMM» a _pour

objet

l’identification et l’utilisation de

_gènes

_(ou

_segments

du

_génome)

contrôlant des caractères

_{quantitatifs.}

Ces

_gènes

seront

_appelés

par la suite

QTL,

pour

quantitative

trait

_loci,

ou

_{plus spécifiquement gène majeur, lorsque}

leur effet

est suffisamment

_important

pour être détecté à l’aide des seules informations

phénotypiques.

Les méthodes

_{développées}

_pouridentifier et utiliser ces

_gènes

font

appel

à des outils

_{mathématiques complexes.}

C’est donc en

_grande

_partie

sur ces

aspects

mathématiques

que nous avons fait

_porter

notre effort.

Ces travaux

_peuvent

être structurés en 2

_parties.

La

première

concerne la mise en évidence de

gènes

à effet

_majeur

et l’utilisation de ces

_gènes

en

_sélection,

à

_partir

d’informations

_{phénotypiques}

_(mesures

sur le caractère dont le contrôle

génétique

est

_recherché)

et

_{généalogiques}

_(relations

de

_parenté

entre individus de la

_population

mesurée).

La deuxième

_partie

concerne l’utilisation

conjointe

de ces informations

phénotypiques

et

_{généalogiques}

avec celles issues du _marquagemoléculaire dans la

détection,

la localisation et l’utilisation de

_QTL.

INFORMATION

_{PHÉNOTYPIQUE}

ET

GÉNÉALOGIQUE

POUR LA MISE EN

ÉVIDENCE

DE

GÈNES

MAJEURS

Détection de

_{gènes majeurs}

La méthode de référence pour le test de l’existence d’un

gène

majeur

dans une

population

est la méthode du maximum de vraisemblance

_(appelée

aussi

_analyse

de

_{ségrégation}

ou

analyse

de

pedigree)

dans

laquelle

on _comparela vraisemblance

des observations

_(ou

_probabilité

d’obtenir ces

observations)

sous les

_hypothèses

de

présence

ou d’absence d’un

gène

_majeur.

En

effet,

il

s’agit

d’une méthode

puissante,

et

_qui

_peut

être définie _pourtoutes les situations

_{expérimentales.}

_Cependant,

son

emploi

pose au moins 3

_types

de

_{problèmes :}

-

la détermination des distributions des

_statistiques

de

test,

élément essentiel pour

maîtriser l’erreur de

_{première espèce}

et connaître la

_puissance

des

tests,

ne

_peut

pas se faire à

_partir

des théories

_{asymptotiques}

_classiques;

- la

complexité

des calculs

_qu’elle

met en oeuvre et l’absence de

_logiciel

facilement

disponible,

rendent son utilisation

délicate;

-

enfin,

elle est _peurobuste à la non-normalité des

_{distributions,}

et

_peut

conduire

à des conclusions

_erronées,

en

_particulier

_pourles caractères à distribution

(3)

Classiquement,

la détermination de la distribution des

statistiques

de test du

_rapport

de vraisemblance se fait en utilisant les résultats

généraux

de la

statistique asymptotique qui

permettent

par

exemple

d’affirmer la convergence du

_rapport

de vraisemblance vers

un

X

2 sous

_{l’hypothèse}

nulle.

_Ici,

les modèles

s’inscrivent dans le cadre

_statistique

des

_mélanges

de distribution où les théories

asymptotiques classiques

ne

s’appliquent

_pas.En effet les conditions de

régularité

ne

sont pas satisfaites. On est confronté en

_particulier

à la non-estimabilité de certains

paramètres

sous

_{l’hypothèse}

nulle d’absence de

gène,

et au caractère non

défini-positif

des matrices d’information. La résolution de ces

problèmes

est nécessaire

pour déterminer la distribution des

statistiques

de test afin de maîtriser l’erreur de

première espèce

et de connaître la

_puissance

de ces tests.

Pons

₍₁₉₉₃₎

et

_Mangin

et al

_(1993a)

ont recherché le seuil du test du

_rapport

de

vraisemblance dans le cas de familles de demi-frères.

Mangin

et al

(1993a)

montrent

que l’utilisation de la méthode de Davies

(1977)

permet

d’avoir un niveau de test

correct,

alors que l’utilisation du niveau issu de la théorie

asymptotique classique

conduit à une erreur de

_{première espèce}

_trop

_importante,

et donc à détecter

trop

de faux

_gènes

_majeurs.

Dans le cas de situations

expérimentales simples

comme le back-cross ou la

F

2 ,

les

_{probabilités}

d’apparition

des différents

_types

d’individus,

homozygotes

et

hétérozygotes,

sont connues a

_priori.

On est alors confronté au caractère non

défini-positif

de la matrice d’information. Pour obtenir la distribution des

_statistiques

de

_test,

Goffinet et al

₍₁₉₉₂₎

et Loisel et al

₍₁₉₉₃₎

ont été amenés à

_développer

ces

_statistiques

à des ordres très élevés

(jusqu’à

l’ordre 8 dans certains

cas).

Par

exemple,

la distribution du test de

_rapport

de vraisemblance sous

l’hypothèse

nulle

dans le cas de la

_F

₂

est le

_mélange

d’un

_x2

à

un

_degré

de liberté avec une

_probabilité

1/2

et d’un

_x

₂

à 2

_degrés

de liberté avec une

_probabilité

1/2.

Vis-à-vis du

_problème

lié à la

_quantité

de calculs de la méthode du maximum

de vraisemblance

_(Le

_Roy,

_1992),

un besoin existait de création et d’évaluation de tests

_statistiques

_{plus simples}

et de mise en oeuvre

_rapide,

_{qui pourraient}

être

utilisés _pourune

_première

_approche,

avec un rôle d’«indicateurs»

justifiant

ou non

le passage à des

analyses plus sophistiquées.

La

comparaison

de

_plusieurs

critères

_{simples, proposés}

dans la littérature ou à

l’occasion de ce

travail,

a été réalisée _parsimulation _parLe

Roy

et Elsen

(1992a),

pour diverses

hypothèses

sur les structures de

_populations

et les

_types

d’hérédité du

caractère. Les conditions d’utilisation

_(seuils

de

_rejet),

la

_puissance

et la robustesse

de ces critères ont été mesurées. Deux

_statistiques

sont apparues

généralement plus

efficaces que les autres : le test

_{d’hétérogénéité}

des variances intrafamilles de Bartlett

et la méthode de

_régression

_{moyenne-variance}

de Fain

_(1978).

Ces critères

_simples,

comme les

plus

complexes,

ont été utilisés dans des

_analyses

de cas

(Duchet-Suchaux

et

al, 1992;

Mandonnet et

al,

1992;

Le

_Roy

et

_al,

₁₉₉₀₎

en introduction d’études

plus

approfondies.

Dans le même

_esprit,

des méthodes

_d’analyse

de

_{ségrégation}

approchée,

qui

avaient été

_{développées}

antérieurement au

_{projet MMM,}

ont été

appliquées

à de très

_{grandes populations}

_(Boichard

et

_al,

_1990).

Ces méthodes sont

_cependant

très _peurobustes à la non-normalité des distri-butions. Cette sensibilité à la non-normalité

conduit

à travailler sur les

techniques

(4)

au sens de Fréchet. Notons

_cependant

que ces méthodes ne sont

_{adaptées qu’à}

de

grands

effectifs,

et nécessitent des calculs très

_complexes.

Utilisation des

_{gènes majeurs}

Notons tout d’abord _queles travaux effectués dans ce cadre concernent le monde animal. Un

_gène

_majeur

ayant

été

détecté,

son utilisation nécessite de connaître

le

_génotype

de tout futur

_{reproducteur,}

ce

_qui

est rarement directement

_possible

d’après

son

phénotype,

_{parce que}le

gène

_peut

avoir une

_expression

limitée à un

seul sexe ou nécessitant

_l’abattage

de

l’animal,

ou parce

qu’il

y a recouvrement des distributions du caractère dans les différents

_génotypes

au locus

_majeur.

Une situation

_fréquente

lors de la fixation d’un

_gène

_majeur

_depuis

une race où

il a été détecté vers une race d’accueil est le

_testage

sur descendance de mâles de

génotype

inconnu _par

_{accouplements}

de ces mâles avec des femelles

homozygotes

récessives et observation

_{phénotypique}

de leurs descendances. Ce

_dispositif

_permet

d’augmenter

la

_précision

du choix des

_{reproducteurs}

_{(multiplication}

des

_mesures)

mais aussi de trier des mâles sur un

_génotype

ne

s’exprimant

_quechez les femelles.

Il est notamment

_employé

pour

l’introgression

du

gène

Booroola

(hyperovulation

des

_brebis)

dans des races ovines

françaises.

En l’absence de _marqueur,le

_problème

se ramène donc essentiellement au test

d’un

_mélange

de distributions

_(la

descendance d’un mâle AB

_accouplé

à des femelles BB est

_composée

_pourmoitié de AB et _pourmoitié de

_BB)

contre une distribution

unique

(de

génotype AA,

le même mâle n’aurait eu _quedes descendants

AB).

Traité

de

_{façon plus}

_exacte,

le

_problème

aboutit à la

_proposition

d’un test

_{d’hypothèses}

non

emboîtées. Goffinet et al

₍₁₉₉₀₎

ont étudié

_{algébriquement}

ce test afin de déterminer la distribution

_asymptotique

de la

_statistique

correspondante,

et évalué la vitesse

de convergence vers cette

_asymptote

_parsimulation.

Des solutions

_approchées

sont toutefois concevables et une étude

_numérique

a

montré que certaines d’entre elles sont tout à fait

performantes

(Elsen

et

_al,

_1991).

En

_particulier,

il est

_possible,

à

_l’image

du modèle unifié de Lalouel et al

_(1983),

d’utiliser l’artifice des

_{probabilités}

de transmission pour créer un test

_{d’hypothèses}

emboîtées dont la distribution

_asymptotique

est un

x

2 .

Au-delà du tri des

_animaux,

les

_stratégies

d’utilisation des

_gènes

_majeurs

identifiés

_peuvent

faire

_l’objet

de réflexions et de modélisation en vue de leur

optimisation.

Les situations diffèrent selon les

_{caractéristiques}

du

_gène

en

_question

(fréquence

initiale,

expression

additive ou

dominante...) (Mandonnet

et

_al,

_1992;

Elsen,

1992).

L’introgression

d’un

_gène

_«exotique»

peut

ainsi

_prendre

diverses formes différant _parleur

_rapidité

d’exécution et leur robustesse.

UTILISATION DE L’INFORMATION ISSUE DU

_MARQUAGE

MOLÉCULAIRE

La

_{disponibilité}

croissante des marqueurs moléculaires

permet

d’envisager

de

recher-cher des

_gènes

dont l’effet est sensiblement moins

_important

et de les

_positionner

sur

le

_génome.

Il

_s’agit

tout d’abord de

_{cartographier}

ces _marqueurssur le

génome.

Ces

(5)

sélection assistée par marqueurs, aide à

l’introgression

de

gènes

identifiés

statisti-quement

ou _par

_l’analyse

de liaison

_génétique,

évaluation des distances

génétiques

entre races,

gestion

des ressources

_{génétiques.}

Cartographie génétique

Dans le cadre

_végétal,

méthodes et

_logiciels

existent _pour

_{cartographier}

les

mar-queurs dans les schémas

simples,

rétrocroisement,

F

2

ou

lignées

recombinantes.

Cependant,

2

_types

de situations n’ont _pasencore _reçude

réponse

tout à fait

satis-faisante,

au moins au niveau des

_logiciels.

Il

s’agit

des croisements concernant des arbres fruitiers ou forestiers car il ne

_s’agit

_pasde croisement entre

_lignées

pures, et du

_problème

des cartes consensus, dont

_l’objectif

est d’utiliser simultanément l’in-formation issue de

_plusieurs

croisements.

_Mangin

et Goffinet

₍₁₉₉₃₎

font le

_point

sur le

_{logiciel Join-Map,}

destiné à

répondre

à ces 2

_questions,

et concluent à son

efficacité.

Plusieurs

_grands

programmes de

cartographie génétique

ont débuté ou débutent

pour les animaux

domestiques.

Des

projets

européens

(PIGMAP’

et

BOVMAP)

ont été lancés _pourles 2

_{espèces économiquement}

_majeures

que sont le porc et le

bovin. En

_parallèle,

des contributions à l’établissement des cartes

_génétiques

des

ovins,

caprins,

poules

et chevaux sont

_également

mises en

place.

Ces

protocoles

utilisent des

_{«populations}

de référence» dont la taille et la structure

_{généalogiques}

peuvent

être

_optimisées

en vue d’une efficacité maximum du travail de

cartographie.

À

l’occasion de la mise en

_place

du _programme

_Bovmap,

une réflexion a été menée

pour cette

_optimisation

_(Elsen

et

al,

1992 et

_1994).

Le critère de choix

peut

reposer

sur un des

_objectifs

_importants

_assignés

à ces cartes

_{génétiques,}

_qui

est l’aide à la

détection de

_QTL.

Pour une même densité de _marqueurs,la

_puissance

de détection

de

_QTL

sera

_plus

_importante

si ces _{marqueurs sont}

régulièrement répartis

le

long

du

génome,

et donc choisis à

_partir

d’une connaissance

_précise

de leurs

_positions.

Ces

auteurs

proposent

ainsi de dimensionner la

_population

de référence de telle sorte _que

la carte de marqueurs résultant de ce choix

_permette,

_pourune

_{puissance donnée,}

de mettre en évidence des

_QTL

avec le minimum d’effort

(nombre

d’individus à mesurer dans un

protocole

de détection de

QTL

utilisant la carte

génétique

en

question).

La structure de la

_population

de référence est déterminée _pardes choix

_portant

sur le nombre de

générations

et de descendants _par

_reproducteur

et sur les animaux

dont il faut déterminer les

_génotypes.

En se basant sur un critère de variance

minimale,

Elsen et al

₍₁₉₉₃₎

montrent

_qu’il

n’est _pas

_{indispensable}

de

typer

la

génération grand-parentale,

que les familles de

pleins-frères

sont de loin

_{préférables}

aux familles de demi-frères

_et,

_qu’à

nombre total d’observations

donné,

le

_typage

des

_conjointes

n’est pas

plus

efficace que le doublement du nombre de descendants par mâle.

Mise en évidence de

QTL

La référence à Neimann-Sorensen et Robertson

₍₁₉₆₁₎

et Sax

₍₁₉₂₃₎

relativise le

caractère novateur de la

_{«génétique»}

moderne. Ce

_qui

est

_changé,

ce n’est _pas

(6)

la découverte de

_techniques

de mise en évidence de

_{polymorphismes}

de l’ADN

_qui

rendent cette recherche

_pratique

et

_probablement

_garantissent

son succès.

De la même

_façon

que dans les tests de détection de

gènes

majeurs,

les méthodes

de référence sont basées sur le maximum de

vraisemblance,

comme la

cartographie

par intervalle

(interval

mapping)

de Lander et Botstein

₍₁₉₈₉₎

_qui

est

_développée

pour des situations

expérimentales simples

(lignées

consanguines, rétrocroisement,

F

2 ).

On rencontre des difficultés du même

_type

que pour la détection de

gènes

majeurs

pour déterminer la distribution des

statistiques

de

tests,

avec en

_particulier

l’apparition

d’un

_paramètre

de

position

sur le

_génome

_qui

pose des

problèmes

très délicats.

De nombreuses méthodes alternatives

sont

_{développées}

dans les cadres animaux

et

_végétaux

de

_façon

à

_pouvoir

traiter des modèles

_plus

_complexes

_(plusieurs

_QTL

par

exemple),

à

permettre

des calculs

_{plus simples}

_pourtraiter des situations

expérimentales complexes,

et à offrir

_plus

de robustesse aux

hypothèses.

Les

_{problèmes statistiques généraux}

Le

_paramètre

de

_position

du

_QTL

sur le

_{génome disparaît}

sous

_{l’hypothèse}

nulle

d’absence de

_QTL.

Il n’est donc pas

possible

d’utiliser les résultats

asymptotiques

classiques.

Rebaï et al

₍₁₉₉₃₎

_proposent

d’utiliser la méthode de Davies

₍₁₉₇₇₎

pour déterminer le seuil du test du

rapport

de vraisemblance et sa

_puissance.

Les

simulations montrent un bon accord avec les résultats

_théoriques.

Ce travail

_permet

de

_plus

de montrer

_{l’équivalence}

_asymptotique

du test de

rapport

de vraisemblance

avec les tests linéarisés de

_Knapp

et al

_(1990),

_qui

sont

_{plus simples}

à calculer et à

généraliser

à des situations

_{complexes : multi-QTL,}

croisement

_diallèle,

etc.

D’autre

_part,

on est confronté au caractère non

_{défini-positif}

de la matrice

d’in-formation,

comme dans les tests de détection de

_gène

_majeur,

_lorsque

l’on introduit des

_paramètres

de dominance du

_QTL

avec des _marqueursdominants.

_Mangin

et

al

_(1993b)

obtiennent la distribution des

_statistiques

sous

_{l’hypothèse}

nulle et sous

des alternatives

_locales,

en utilisant des

développements

de la vraisemblance à des

ordres très élevés.

Les situations animales

Les méthodes

_statistiques

les

_{plus développées}

_{pour mettre}en évidence ces

QTL

sont basées sur le

_test,

dans un cadre

linéaire,

des effets des allèles _marqueurs

intrapère

ou

_grand-père

(Soller

et

_Genizi,

_1978;

Weller et

_al,

_1990).

_Foulley

₍₁₉₉₁₎

propose une formule alternative de calcul direct de la

_puissance

de détection d’un

QTL

associé à un _{marqueur, pour}les

dispositifs

de contrôles de descendance de

mâles des

_première

_(Soller

et

_Genizi,

_1978),

ou de deuxième

_génération

(Weller

et

al,

1990).

Cette formule _reposesur une

_{approximation asymptotique}

(grand

nombre

d’allèles au

QTL)

et

suppose,

comme le font Fernando et Grossman

_(1989),

que

l’effet du

_gène

au

_QTL

transmis _parle

_père

chez un de ses descendants

_quelconque

soit une variable aléatoire.

En se limitant au test d’une

_simple

hérédité

_monogénique

liée au _marqueur

dis-ponible,

Le

_Roy

et Elsen

_(1992,

₁₉₉₃₎

évaluent le

_gain

de

_puissance

_apporté

_par

(7)

différences de forme de distribution du caractère

_quantitatif

chez les descendants d’un

_père

doublement

_{hétérozygote}

_(au

locus _{marqueur et}au locus

quantitatif)

se-lon l’allèle _{marqueur reçu}du

_père,

et non seulement les différences dans

_{l’espérance}

de ces distributions. Ce

_gain

peut

être

_important

dans le cas de

_QTL

à faible

effet,

faiblement liés au locus _{marqueur et pour}des tailles limitées de

_population

(gain

de

50%

pour un

QTL

dominant dont l’effet est de

_0,2

écart

_type,

et

qui

est situé à

10%

de recombinaison du marqueur, en utilisant une

population

de 5

grand-pères,

100

_{pères/grand-père}

et 100

_{descendants/père).}

Cette étude montre

_également

que, dans ces situations où un seul

_QTL

contrôle le

_caractère,

le

_gain

_apporté

_parles

marqueurs par

rapport

à

_l’analyse

de

_{ségrégation}

classique

est faible. Cette étude est maintenant

_prolongée

_parun travail

équivalent

dans le cas d’une hérédité mixte

combinant

un

_QTL

lié au _marqueurétudié et un ensemble d’autres

_gènes

indépen-dants.

En

_pratique,

la recherche de

_QTL

se fera à

_partir

d’une carte de _marqueurs.

_Or,

pour un même

_individu,

un locus _marqueur

_peut

ne _pasêtre informatif

_quand

des

locus voisins le sont. Les informations

apportées

par tous les marqueurs

présents

dans une zone du

_génome

doivent donc être simultanément utilisées. Nous nous sommes

_placés

dans le cas

particulier

du croisement

F

I

et

F

2 entre

2

_lignées

extrêmes du

_point

de vue

_quantitatif

(QTL

fixés à l’état

homozygote

dans les races

_pures),

mais où les allèles aux locus _{marqueurs sont}en

_{ségrégation.}

Il

_s’agit

vraisemblablement de la situation

_qui

_prévaudra

pour la détection de

QTL

chez le _{porc à}

_partir

de croisements entre une race

_européenne

_{(Large White)}

et une race chinoise

(Meishan).

Dans ce

_contexte,

_Haley

et al

₍₁₉₉₄₎

ont

_développé

un

algorithme

exact dans le cas de _marqueurs

_codominants,

sans données

_manquantes,

pour le traitement simultané de tous les marqueurs d’un même groupe de liaison.

Son évaluation par simulation

indique

que cette

technique

est

plus

puissante

et robuste _que

_l’analyse

_{uni marqueur.}

Il est intéressant _parailleurs de rechercher des méthodes

_{plus simples}

à calculer et

_plus

robustes aux

_hypothèses

de normalité des distributions. La méthode de Ha-seman et Elston

₍₁₉₇₂₎

HE basée sur les

_couples

de

_germains,

offre ces

_avantages

(Blackwelder

et

_Elston,

_1982),

mais est en

_contrepartie

_peu

_puissante.

Avec des

marqueurs hautement

polymorphes,

l’utilisation exclusive

_{d’accouplements}

totale-ment informatifs

_peut

être

_envisagée.

Gôtz et Ollivier

₍₁₉₉₂₎

ont

_étudié,

à l’aide de

simulations,

l’effet d’un

_{système génétique}

hautement

_polymorphe

₍₅

allèles

éga-lement

_fréquents),

d’une

_grande

taille de fratrie

_{(6 germains)}

et d’une structure

d’élevage polygynique

(25

femelles

_accouplées

à

_chaque

_mâle)

sur la

_puissance

du

test HE. Les résultats _{montrent que}la

_puissance

est

considérablement

accrue

quand

on

_dispose

à la fois de _marqueurshautement

_polymorphes

et de

_grandes

fratries. Avec un nombre total d’individus

typés

de

_5000,

et _pourun locus

expliquant

8%

de la variance

_{phénotypique}

du

_caractère,

la

_puissance

du test au niveau

5%

est de

0,74

au lieu de

_0,14

_quand

on _passede 2 à 5 allèles au locus _{marqueur, et}de 2 à 6

frères _parfratrie.

Les situations

_végétales

La

_plupart

des méthodes de recherche de

_QTL

_(Lander

et

_Botstein,

1989;

Knapp

et

_al,

₁₉₉₀₎

sont fondées sur

_{l’hypothèse}

_queceux-ci sont bien

_séparés

les uns

(8)

dans son ensemble et recherché des

_{régions chromosomiques impliquées}

dans la variation de caractères

_quantitatifs

entre 2

_lignées

_{pures et}leurs

_produits

de

croisement.

_Rodolphe

et Lefort

₍₁₉₉₃₎

ont

_développé

une méthode

adaptée

aux

F

2 ,

rétrocroisements et

_haploïdes

doublés. Les marqueurs doivent être codominants et les données

_manquantes

sont admises. Cette

_{méthode, qui}

ne _{repose pas}sur

des

_{hypothèses génétiques}

_fortes,

doit être utilisée avec des densités de _marquage

raisonnables,

mais

_{présente l’avantage}

de

_prendre

en

_compte

simultanément l’effet

de tous les

_QTL.

On doit donc en attendre une réduction de la variance résiduelle

dans le cas où coexistent

_{plusieurs QTL.}

Une

_perspective

intéressante serait

d’analyser

les données avec cette

méthode,

en conservant les marqueurs sur tous les

groupes de liaison sauf un,

puis

analyser

les résidus avec une méthode

séquentielle

en conservant cette fois tous les _marqueurs

_disponibles

sur le dernier _groupede

liaison seulement.

Ces méthodes sont

_adaptées

aux situations

expérimentales

les

plus classiques.

Si l’on cherche à étudier la stabilité d’un

_QTL

dans différents fonds

_{génétiques,}

il est intéressant d’utiliser un croisement diallèle avec

_{plusieurs lignées.}

Rebaï et Goffinet

₍₁₉₉₃₎

ont étudié la

_puissance

de différents tests de détection de

_QTL

dans ce

_cadre,

_pourdes observations faites sur des

_topcross

ou

_F

₃

_.

Il

_apparaît

_que

les tests

_qui

utilisent l’information

_conjointe

des différents croisements du diallèle

sont sensiblement

_plus

_puissants

que les tests

_classiques,

et

_qu’il

est

_préférable

de

ne _pas

_intégrer

de terme de dominance dans le modèle. Ce travail se

_poursuit

_par

la mise au

_point

d’une méthode de

_cartographie

_parintervalle dans ce cadre.

Utilisation des marqueurs pour l’amélioration

génétique

La sélection assistée par marqueurs

peut

être basée sur l’utilisation d’un

déséquilibre

de liaison entre ces _{marqueurs et}des

QTL

(Lande,

Thompson,

1990),

ou sur le suivi

_{généalogique}

des

_génotypes

des candidats à la

_reproduction

_(Le

_Roy,

_1992,

Elsen,

1992,

Le

_Roy

et

_Elsen,

1992,

Boichard et

_al,

_1993).

Dans le

_premier

cas il

est à craindre _quele

_{déséquilibre s’estompe}

au cours des

générations,

après

son

apparition

à la suite d’un croisement ou d’une

_mutation,

et ceci d’autant

_plus

_que

la liaison

_marqueur-QTL

est faible. Dans le second cas il convient de mettre en

place

un suivi

_précis

des

_performances

et des

_génotypes

_marqueursdes individus de

la

_population

afin d’estimer les

_génotypes

_{au(x) QTL(s)}

et de

_piéger

le cas échéant

les événements de recombinaison.

L’apport

des marqueurs pour

l’introgression

des

gènes

est

_{beaucoup plus}

immédiat. D’une

_part,

il

_permet

d’identifier

_rapidement,

dès la

_naissance,

sur

n’im-porte

quel individu,

mâle ou

_femelle,

son

_génotype

au locus faisant

_l’objet

de

l’intro-gression

(Hospital

et

_Elsen,

_1992).

D’autre

part,

il

permet

d’accélérer le processus de restauration du

_génome

de la race ou de la variété receveuse en utilisant

l’in-formation

_apportée

_parles

_génotypes

en

_plusieurs

_marqueurs

_disposés

le

long

du

génome,

les individus retenus étant ceux

_qui

ont la

_proportion

maximum d’allèles

spécifiques

de la race ou de la variété receveuse.

Hospital

et al

₍₁₉₉₂₎

ont étudié les

effets de la durée et de l’intensité de la

_sélection,

de la taille de la

_population,

du

nombre et de la

_position

des marqueurs sélectionnés sur les chromosomes

_portant

ou ne

_portant

_pasle

_{gène introgressé.}

Ils _{montrent que}l’utilisation de _marqueurs

(9)

données par Hillel et al

(1990).

Les marqueurs sont

plus

utiles

lorsque

leur

posi-tion est connue. Ils montrent que dans les

_{premières générations,}

il ne sert à rien

d’utiliser

_plus

de 3 _{marqueurs pour}

_chaque

chromosome non

_porteur.

Concernant

le chromosome

porteur,

il

_{apparaît qu’il}

est

_préférable

de

_typer

relativement _peu

d’individus _pourde nombreux marqueurs

plutôt

que de nombreux individus pour

quelques

marqueurs

proches

du

gène.

Ce travail fournit les bases de raisonnement

nécessaires à la définition d’une

_{stratégie optimale}

de sélection

_adaptée

à

_chaque

cas

particulier.

Enfin,

les marqueurs

permettent

de définir des indices de distance

_génétique

entre

lignées.

Charcosset et al

₍₁₉₉₁₎

ont étudié la corrélation p entre un index de ce

_type

défini pour 2

lignées parentales

et l’hétérosis observé dans la

F

I

issue de ces

lignées,

pour un caractère

quantitatif.

Les calculs

théoriques

de cette corrélation sont faits

en utilisant un modèle

_{biallélique.}

_Lorsque

les allèles au locus _marqueuret au

_QTL

sont

_également

distribués à l’intérieur de la

_population

des

_lignées

considérées,

le

coefficient _pest une fonction des carrés des

déséquilibres

de liaison entre les allèles au locus _marqueuret les allèles au

_QTL.

Les

QTL

_qui

ne _{sont pas}

marqués

_par un locus marqueur, et les marqueurs

qui

ne _{sont pas}liés à un

QTL,

_jouent

un rôle

symétrique

et

_peuvent

faire décroître _pde manière

_importante.

En

_conclusion,

la

prédiction

de l’hétérosis d’un

_hybride

F

i

à

_partir

de _marqueursserait

_plus

efficace

si ces _marqueursétaient sélectionnés sur leurs liaisons avec les

QTL.

Ce même

_type

de modèle est utilisé par Charcosset et Essioux

(1993)

pour étudier l’effet sur le

coefficient _pde la structuration des

_lignées

en _groupes

hétérotiques.

Il

apparaît

_que

l’on trouvera des valeurs

_{significatives}

de _{p si}les

_{lignées appartiennent}

à un même

groupe

hétérotique,

mais que l’on ne trouvera aucune relation _pourdes

hybrides

entre

_lignées

_appartenant

à des groupes

différents,

car le

déséquilibre

de liaison varie

de manière

aléatoire

d’un _groupeà l’autre. Ces résultats sont cohérents avec les

résultats

_{expérimentaux}

et

_soulignent

la nécessité de mettre au

_point

de nouveaux

modèles de

_prédiction

pour mieux valoriser l’information.

Perspectives

La

_{disponibilité}

croissante de marqueurs moléculaires ne fait pas

disparaître

l’intérêt de détecter et d’utiliser des

_{gènes majeurs}

à

_partir

des seules informations

phénoty-piques

et

_{généalogiques.}

Il existe en effet un

grand

nombre de données

phénotypi-ques non encore

_exploitées

et le marquage reste relativement coûteux. Il reste donc intéressant de travailler sur les

_aspects

_{méthodologiques}

du traitement de telles

données, qui

en

_plus

de l’intérêt _propredes

méthodes,

sont souvent un _passage

obligé

avant de traiter de

_{problèmes plus}

compliqués

impliquant

des marqueurs.

Les

_aspects

_prioritaires

semblent être le traitement de

_pedigrees

complexes

et la recherche de robustesse.

Les

_{problèmes méthodologiques}

concernant l’utilisation des _{marqueurs restent} très

_importants

et de nouveaux

_problèmes

voient le

_jour

au fur et à mesure _quese

développent

des nouvelles

_pistes

d’utilisation des marqueurs en sélection :

-

cartographie :

il faut

_développer

des

_algorithmes

de calcul efficaces pour les

pedigrees

animaux et proposer des

_algorithmes

et des _{tests pour}déterminer

(10)

- recherche de

QTL :

il reste encore de nombreux

_problèmes

_statistiques

non

parfaitement résolus,

comme l’intervalle de confiance de la

_position

des

_QTL

ou le test de l’existence de

_{plusieurs QTL ;}

-

par ailleurs il faut

développer

des

_algorithmes

et des

_logiciels

pour traiter

des situations

animales;

la

_{participation}

à un réseau

_européen

en cours de

constitution devrait

_permettre

d’accélérer les travaux dans cette

_direction;

- utilisation

en sélection :

_beaucoup

de choses restent à faire dans la mise au

_point

de méthodes et critères de sélection assistée par marqueurs et de construction de

_génotypes

associant un ensemble de

QTL

favorables.

REMERCIEMENTS

Nous tenons à remercier l’AIP INRA

_{Agrotech-Prodige, qui}

est à

_l’origine

de la création du groupe MMM et

_qui

en a assuré le financement de mai 1990 à mai 1993.

RÉFÉRENCES

Blackwelder

_WC,

Elston RC

₍₁₉₈₂₎

Power and robustness of

_{sib-pair linkage}

tests

and extension to

_{larger sibships.}

Commun Statist-Theor Methods

_11,

449-484

Boichard

_D,

Chevalet

_C,

Le

_Roy

P,

Elsen JM

₍₁₉₉₃₎

Les

perspectives

d’utilisation

des _marqueurs

_génétiques

chez les animaux

_domestiques.

Réunion de l’AFZ.

_Nantes,

25-26 mai 1993

Boichard

_D,

Elsen

_JM,

Le

_Roy

_P,

Bonaiti B

₍₁₉₉₀₎

_{Segregation analysis}

of fat

content data in Holstein x

European

Friesian crossbred cattle. In : Proc Fourth

World

Congr

Genet

_Appl

Livest Prod

_(Hill,

_Thompson,

Wooliams,

eds),

XIV,

167-170

Charcosset

_A,

Essioux L

₍₁₉₉₄₎

The effect of

_germplasm

structuration on the

relationship

between heterosis and

_{heterozygosity}

at marker loci. Theor

_Appl

Genet

(à

paraître)

Charcosset

_A,

Lefort

M,

Gallais A

₍₁₉₉₁₎

_Relationship

between heterosis and

heterozygosity

at marker loci: a theoretical

_computation.

Theor

_Appl

Genet

_81,

571-575

Davies RB

₍₁₉₇₇₎

_Hypothesis

_testing

when a nuisance

_parameter

is

_present

_only

under the alternative. Biom.etrika

_64,

247-254

Duchet-Suchaux

_M,

Menateau

_P,

Le Roux

_H,

Elsen

_JM,

_Lechopier

P

₍₁₉₉₂₎

Genetic

control of resistance to

_{enterotoxigenic}

Escherichia coli in infant mice. Microb

Pathogen

13,

157-160

Elsen JM

₍₁₉₉₂₎

What should be

_expected

from

_major

_genesfor

_reproduction

in

sheep ? Symposium &dquo;Perspektiven

der

_{Nutztierwissenschaften&dquo;,}

Anliissllich des 65.

Geburtstages

von Prof Dr R

_{Wassmuth, Giessen,}

9 Màrz 1993

Elsen

_JM,

Le

_Roy

_P,

Goffinet B

₍₁₉₉₁₎

_Comparison

of four

statistical

tests for

genotype

determination at a

_major

locus of _progenytested sires. J Anirn Breed

Genet

_{108, 167-173}

Elsen

_JM,

_Mangin

_B,

Goffinet

_B,

Chevalet C

₍₁₉₉₂₎

Protocol

_designs

for

_building

genetic

linkage

map in livestock. 43e Réunion annuelle de la

FEZ,

Commission de

(11)

Elsen

_{JM, Mangin B,}

Goffinet

B,

Chevalet C

₍₁₉₉₄₎

_Optimal

structure of

_protocol

designs

for

_building

_genetic

_linkage

map in livestock. Theor

Appl

Genet

(À

paraître)

Fain PR

₍₁₉₇₈₎

Characteristics of

_{simple sibship}

variance tests for the detection

of

_major

loci and

_application

to

_{height, weight}

and

_{spatial performance.}

Ann Hum

Genet

_42,

109-120

Fernando

_R,

Grossman M

₍₁₉₈₉₎

Best linear unbiased

_prediction

and marker

assisted selection. Genet Sel

_{Evol 21,}

467-477

Foulley

JL

₍₁₉₉₁₎

_{Exposé critique}

des

_dispositifs

«filles» et

_«petites

filles»

proposés

par Weller et

al, 1990,

pour la mise en évidence des

QTL.

_Rapport

interne

INRA,

Domaine de

Vilvert,

78352

_{Jouy-en-Josas}

Cedex

Goffinet

_B,

Elsen

JM,

Le

_Roy

P

₍₁₉₉₀₎

Statistical tests for identification of the

genotype

at a

_major

locus of _progenytested sires. Biometrics

46,

583-594

Goffinet

_B,

Loisel

_P,

Laurent B

₍₁₉₉₂₎

_Testing

in normal mixture models when the

proportion

are known. Biorrcetrika

_79,

842-846

Gotz

_KU,

Ollivier L

₍₁₉₉₂₎

Theoretical

aspects

of

_{applying sib-pair linkage}

tests to

livestock

_species.

Genet Sel Evol

_24,

29-42

Haley CS,

Knott

_SA,

Eisen JM

₍₁₉₉₄₎

_Mapping

quantitative

trait loci in crosses

between outbred lines

_using

least _squares.Genetics

_(à

_paraître)

Haseman

JK,

Elston RC

₍₁₉₇₂₎

The

investigation

of

_linkage

between a

_quantitative

trait and a marker locus. Behav Genet

_1,

3-19

Hillel

_J,

_Schaap

_T,

Haberfeld A et al

₍₁₉₉₀₎

DNA

_{fingerprint applied}

to gene

introgression

breeding

programs. Genetics

124,

783-789

Hospital

F,

Chevalet

_C,

Mulsant P

₍₁₉₉₂₎

_Using

markers _{in gene}

_{introgression}

breeding

programs. Genetics

132,

1199-1210

Hospital

F,

Elsen JM

₍₁₉₉₂₎

_{Introgression génique}

assistée par marqueurs. INRA Prod Anim Hors série «Eléments de

_génétique

_quantitative

et

_application

aux

populations animales»,

299-302

Knapp

SJ,

Bridges

WC,

Birkes D

₍₁₉₉₀₎

_Mapping

_quantitative

trait loci

_using

molecular marker

_linkage

maps. Theor

Appl

Genet

79,

583-592

Lalouel

_JM,

Rao

_DC,

Morton

_{NE ,}

Elston RC

₍₁₉₈₃₎

A unified model for

_complex

segregation analysis.

Am J Hum Genet

_35,

816-826

Lande

_{R, Thompson}

R

₍₁₉₉₀₎

_Efficiency

of marker assisted selection in the

improvement

of

_quantitative

traits. Genetics

_124,

743-756

Lander

_ES,

Botstein D

₍₁₉₈₉₎

_Mapping

mendelian factors

_underlying

quantitative

traits

_using

RFLP

_linkage

maps. Genetics

121,

185-199

Lemdani M

₍₁₉₉₁₎

Estimation du mode d’une densité unimodale par un critère de

minimum de distance. DEA de

_statistiques

et modèles

aléatoires,

Orsay

Le

_Roy

P

₍₁₉₉₂₎

Les méthodes de mise en évidence des

gènes

majeurs.

INRA Prod

Anim Hors série «Eléments de

_génétique

_quantitative

et

_application

aux

populations

animales»,

93-99

Le

_{Roy P,}

Elsen JM

_(1992a)

_Simple

test statistics for

_major

gene detection: a

numerical

_comparison.

Theor

_Appl

Genet

_83,

635-644

Le

_Roy

_P,

Elsen JM

_(1992b)

Numerical

_comparison

between maximum likelihood and

_analysis

of variance methods for

_QTL

detection in progeny test

designs.

43e Réunion annuelle de la

_FEZ,

14-17

_septembre

_1992,

Madrid

(12)

Le

_Roy

_P,

Elsen JM

₍₁₉₉₃₎

Numerical

_comparison

between maximum likelihood and

analysis

of variance methods for

_QTL

_{detection in progeny}test

_{designs. Monogenic}

inheritance. Theor

_Appl

Genet

_{(à paraître)}

Le

_Roy

P,

Naveau

J,

Elsen

_JM,

Sellier P

₍₁₉₉₀₎

Evidence for a new

_major

_gene

influencing

meat

_quality

in

_pigs.

Genet Res Camb

_55,

33-40

Loisel

_P,

Goffinet

_B,

Monod

_H,

Montes de Occa G

₍₁₉₉₃₎

Detecting major

gene in

an F2

population.

Biometrics

(à

paraître)

Mandonnet

N,

Le

_{Roy P,}

Caritez

_JC,

Eisen

_JM,

_Legault

C,

Bidanel JP

₍₁₉₉₂₎

Existe-t-il un

_gène

à effet

_{majeur expliquant}

la

prolificité exceptionnelle

de la race Meishan? 43e réunion annuelle de la

FEZ,

14-18

septembre

1992,

Madrid,

Commission de

_génétique

animale,

Abstract : vol

_1,

126-127

Mangin

B,

Goffinet B

₍₁₉₉₃₎

_Comparaison

de

_logiciels

pour l’obtention de cartes

consensus.

_Rapport

interne

INRA,

Auzeville,

31326 Castanet-Tolosan

Mangin

B,

Goffinet

B,

Eisen JM

_(1993a)

_Testing

in normal mixture models with

some information on the

_parameter.

Biometrical J

(à paraître)

Mangin B,

Goffinet

_B,

Rebaï A

_(1993b)

_QTL

detection and dominant markers.

Rapport

interne,

INRA,

Auzeville,

31326 Castanet-Tolosan

Neimann-Sorensen

_A,

Robertson A

₍₁₉₆₁₎

The association between blood groups and several

_production

characteristics in three Danish cattle breeds. Acta

_Agr

Scand

11,

163-196

Pons 0

₍₁₉₉₃₎

_Homogeneity

test in distribution mixtures and

application

to

_major

genes detection. Statistics

24,

149-160

Rebaï

A,

Goffinet B

₍₁₉₉₃₎

Power of different tests for

_QTL

detection

_using

progenies

derived from a diallel cross. Theor

Appl

Genet

86,

1014-1022

Rebaï

_A,

Goffinet

_B,

_Mangin

B

₍₁₉₉₃₎

_Comparing

_powerof different methods for

QTL

detection. Biometrics

_{(à paraître)}

Rodolphe

F,

Lefort M

₍₁₉₉₃₎

A multi-marker model for

_detecting

chromosomal

segments

displaying QTL

activity.

Genetics

_134,

1277-1288

Sax K

₍₁₉₂₃₎

Association of size differences with seed-coat

pattern

and

pigmenta-tion in Phaseolus

_vulgaris.

Genetics

_8,

552-560

Soller

_M,

Genizi A

₍₁₉₇₈₎

The

_efficiency

of

_{experimental designs}

for the detection of

_linkage

between a marker locus and a locus

affecting

a

_quantitative

trait in

segregating populations.

Biometrics

34,

7-55

Weller

_JL,

Kashi

_Y,

Soller M

₍₁₉₉₀₎

Power

_{of daughter}

and

_{granddaughter designs}

for

_{determining linkage}

between marker loci and

_quantitative

trait loci in

_dairy

cattle. J

_Dairy

Sci

_73,

2525-2537