Article
original
Méthodes
mathématiques
pour
l’étude des
gènes
contrôlant
des caractères
quantitatifs
B
Goffinet
J
Beckmann,
D
Boichard,
M
Causse,
A
Charcosset,
C
Chevalet,
C
Christophe,
JJ
Colleau,
F
Demenais,
CE
Durel,
JM
Elsen,
JL
Foulley,
A
Gallais,
KU
Götz,
F
Hospital,
A
Kremer,
M
Lorieux,
M
Lefort-Buson,
P
Le
Roy,
P
Loisel,
B
Mangin,
A
Maurice,
X
Perrier,
O
Pons,
A
Rebaï,
F
Rodolphe,
M
San
Cristobal,
J Vu
Tien
Khang
(groupe MMM)
1
Institut
national de la rechercheagronomique,
station de biométrie et
intelligence artificielle,
Chemin de
Borde-Rouge, Auzeville,
BP 27, 31326 Castanet-TolosanCedex,
FranceRésumé - Nous
présentons
ici les travaux s’inscrivant dans le cadre duprojet
«Mathéma-tiques
et marqueursmoléculaires»,
enabrégé
«MMM». Ces travaux ont pourobjet
l’iden-tification et l’utilisation degènes
contrôlant des caractèresquantitatifs -
ouQTL
(quan-titative trait
loci) -
àpartir
de l’information issue desphénotypes,
de lagénéalogie
et demarqueurs moléculaires. Une
première
partie concerne la mise en évidence degènes
à effetmajeur
et l’utilisation de cesgènes
ensélection,
àpartir
d’informationsphénotypiques
(mesures
sur le caractère dont le contrôlegénétique
estrecherché)
etgénéalogiques
(rela-tions de
parenté
entre individus de lapopulation
mesurée).
La deuxièmepartie
concernel’utilisation
conjointe
de ces informationsphénotypiques
etgénéalogiques
avec cellesis-sues du marquage moléculaire dans la
détection,
la localisation deQTL,
et en améliorationgénétique.
cartographie
/
gène majeur/
marqueur moléculaire/
maximum de vraisemblance/
locus de caractère quantitatifSummary - Mathematical methods for studying genes controlling quantitative traits. We present in this paper the results
of
theproject
"Mathematics and Molecular Markers" "(MMM).
These results concern theidentification
and useof genes
that control quantitativecharacters or
QTL
(quantitative
traitloci),
usingphenotypic, genealogical
and molecular markerinformation.
Thefirst
section concernsidentification of major
genes usingindividuals)
type and useof
these genes in selection. The second section concerns the useof
this
information
jointly
with molecular markerinformation for
detection and localisationof QTL,
andfor genetic
improvement.mapping
/
major gene/
molecular marker/
maximum likelihood/
quantitative trait locusINTRODUCTION
L’ensemble des travaux s’inscrivant dans le cadre du
projet
«MMM» a pourobjet
l’identification et l’utilisation degènes
(ou
segments
dugénome)
contrôlant des caractèresquantitatifs.
Cesgènes
serontappelés
par la suiteQTL,
pourquantitative
traitloci,
ouplus spécifiquement gène majeur, lorsque
leur effetest suffisamment
important
pour être détecté à l’aide des seules informationsphénotypiques.
Les méthodesdéveloppées
pour identifier et utiliser cesgènes
fontappel
à des outilsmathématiques complexes.
C’est donc engrande
partie
sur cesaspects
mathématiques
que nous avons faitporter
notre effort.Ces travaux
peuvent
être structurés en 2parties.
Lapremière
concerne la mise en évidence degènes
à effetmajeur
et l’utilisation de cesgènes
ensélection,
àpartir
d’informations
phénotypiques
(mesures
sur le caractère dont le contrôlegénétique
est
recherché)
etgénéalogiques
(relations
deparenté
entre individus de lapopulation
mesurée).
La deuxièmepartie
concerne l’utilisationconjointe
de ces informationsphénotypiques
etgénéalogiques
avec celles issues du marquage moléculaire dans ladétection,
la localisation et l’utilisation deQTL.
INFORMATION
PHÉNOTYPIQUE
ETGÉNÉALOGIQUE
POUR LA MISE ENÉVIDENCE
DEGÈNES
MAJEURSDétection de
gènes majeurs
La méthode de référence pour le test de l’existence d’un
gène
majeur
dans unepopulation
est la méthode du maximum de vraisemblance(appelée
aussianalyse
deségrégation
ouanalyse
depedigree)
danslaquelle
on compare la vraisemblancedes observations
(ou
probabilité
d’obtenir cesobservations)
sous leshypothèses
deprésence
ou d’absence d’ungène
majeur.
Eneffet,
ils’agit
d’une méthodepuissante,
et
qui
peut
être définie pour toutes les situationsexpérimentales.
Cependant,
sonemploi
pose au moins 3types
deproblèmes :
-
la détermination des distributions des
statistiques
detest,
élément essentiel pourmaîtriser l’erreur de
première espèce
et connaître lapuissance
destests,
nepeut
pas se faire à
partir
des théoriesasymptotiques
classiques;
- la
complexité
des calculsqu’elle
met en oeuvre et l’absence delogiciel
facilementdisponible,
rendent son utilisationdélicate;
-
enfin,
elle est peu robuste à la non-normalité desdistributions,
etpeut
conduireà des conclusions
erronées,
enparticulier
pour les caractères à distributionClassiquement,
la détermination de la distribution desstatistiques
de test durapport
de vraisemblance se fait en utilisant les résultatsgénéraux
de lastatistique asymptotique qui
permettent
parexemple
d’affirmer la convergence durapport
de vraisemblance versun
X
2
sous
l’hypothèse
nulle.Ici,
les modèless’inscrivent dans le cadre
statistique
desmélanges
de distribution où les théoriesasymptotiques classiques
nes’appliquent
pas. En effet les conditions derégularité
nesont pas satisfaites. On est confronté en
particulier
à la non-estimabilité de certainsparamètres
sousl’hypothèse
nulle d’absence degène,
et au caractère nondéfini-positif
des matrices d’information. La résolution de cesproblèmes
est nécessairepour déterminer la distribution des
statistiques
de test afin de maîtriser l’erreur depremière espèce
et de connaître lapuissance
de ces tests.Pons
(1993)
etMangin
et al(1993a)
ont recherché le seuil du test durapport
devraisemblance dans le cas de familles de demi-frères.
Mangin
et al(1993a)
montrentque l’utilisation de la méthode de Davies
(1977)
permet
d’avoir un niveau de testcorrect,
alors que l’utilisation du niveau issu de la théorieasymptotique classique
conduit à une erreur depremière espèce
trop
importante,
et donc à détectertrop
de faux
gènes
majeurs.
Dans le cas de situations
expérimentales simples
comme le back-cross ou laF
2
,
lesprobabilités
d’apparition
des différentstypes
d’individus,
homozygotes
ethétérozygotes,
sont connues apriori.
On est alors confronté au caractère nondéfini-positif
de la matrice d’information. Pour obtenir la distribution desstatistiques
de
test,
Goffinet et al(1992)
et Loisel et al(1993)
ont été amenés àdévelopper
ces
statistiques
à des ordres très élevés(jusqu’à
l’ordre 8 dans certainscas).
Parexemple,
la distribution du test derapport
de vraisemblance sousl’hypothèse
nulledans le cas de la
F
2
est lemélange
d’unx2
à
undegré
de liberté avec uneprobabilité
1/2
et d’unx
2
à 2degrés
de liberté avec uneprobabilité
1/2.
Vis-à-vis du
problème
lié à laquantité
de calculs de la méthode du maximumde vraisemblance
(Le
Roy,
1992),
un besoin existait de création et d’évaluation de testsstatistiques
plus simples
et de mise en oeuvrerapide,
qui pourraient
êtreutilisés pour une
première
approche,
avec un rôle d’«indicateurs»justifiant
ou nonle passage à des
analyses plus sophistiquées.
La
comparaison
deplusieurs
critèressimples, proposés
dans la littérature ou àl’occasion de ce
travail,
a été réalisée par simulation par LeRoy
et Elsen(1992a),
pour diverses
hypothèses
sur les structures depopulations
et lestypes
d’hérédité ducaractère. Les conditions d’utilisation
(seuils
derejet),
lapuissance
et la robustessede ces critères ont été mesurées. Deux
statistiques
sont apparuesgénéralement plus
efficaces que les autres : le test
d’hétérogénéité
des variances intrafamilles de Bartlettet la méthode de
régression
moyenne-variance
de Fain(1978).
Ces critèressimples,
comme les
plus
complexes,
ont été utilisés dans desanalyses
de cas(Duchet-Suchaux
et
al, 1992;
Mandonnet etal,
1992;
LeRoy
etal,
1990)
en introduction d’étudesplus
approfondies.
Dans le mêmeesprit,
des méthodesd’analyse
deségrégation
approchée,
qui
avaient étédéveloppées
antérieurement auprojet MMM,
ont étéappliquées
à de trèsgrandes populations
(Boichard
etal,
1990).
Ces méthodes sont
cependant
très peu robustes à la non-normalité des distri-butions. Cette sensibilité à la non-normalitéconduit
à travailler sur lestechniques
au sens de Fréchet. Notons
cependant
que ces méthodes ne sontadaptées qu’à
degrands
effectifs,
et nécessitent des calculs trèscomplexes.
Utilisation des
gènes majeurs
Notons tout d’abord que les travaux effectués dans ce cadre concernent le monde animal. Un
gène
majeur
ayant
étédétecté,
son utilisation nécessite de connaîtrele
génotype
de tout futurreproducteur,
cequi
est rarement directementpossible
d’après
sonphénotype,
parce que legène
peut
avoir uneexpression
limitée à unseul sexe ou nécessitant
l’abattage
del’animal,
ou parcequ’il
y a recouvrement des distributions du caractère dans les différentsgénotypes
au locusmajeur.
Une situation
fréquente
lors de la fixation d’ungène
majeur
depuis
une race oùil a été détecté vers une race d’accueil est le
testage
sur descendance de mâles degénotype
inconnu paraccouplements
de ces mâles avec des femelleshomozygotes
récessives et observation
phénotypique
de leurs descendances. Cedispositif
permet
d’augmenter
laprécision
du choix desreproducteurs
(multiplication
desmesures)
mais aussi de trier des mâles sur ungénotype
nes’exprimant
que chez les femelles.Il est notamment
employé
pourl’introgression
dugène
Booroola(hyperovulation
desbrebis)
dans des races ovinesfrançaises.
En l’absence de marqueur, le
problème
se ramène donc essentiellement au testd’un
mélange
de distributions(la
descendance d’un mâle ABaccouplé
à des femelles BB estcomposée
pour moitié de AB et pour moitié deBB)
contre une distributionunique
(de
génotype AA,
le même mâle n’aurait eu que des descendantsAB).
Traitéde
façon plus
exacte,
leproblème
aboutit à laproposition
d’un testd’hypothèses
nonemboîtées. Goffinet et al
(1990)
ont étudiéalgébriquement
ce test afin de déterminer la distributionasymptotique
de lastatistique
correspondante,
et évalué la vitessede convergence vers cette
asymptote
par simulation.Des solutions
approchées
sont toutefois concevables et une étudenumérique
amontré que certaines d’entre elles sont tout à fait
performantes
(Elsen
etal,
1991).
En
particulier,
il estpossible,
àl’image
du modèle unifié de Lalouel et al(1983),
d’utiliser l’artifice desprobabilités
de transmission pour créer un testd’hypothèses
emboîtées dont la distribution
asymptotique
est unx
2
.
Au-delà du tri des
animaux,
lesstratégies
d’utilisation desgènes
majeurs
identifiéspeuvent
fairel’objet
de réflexions et de modélisation en vue de leuroptimisation.
Les situations diffèrent selon lescaractéristiques
dugène
enquestion
(fréquence
initiale,
expression
additive oudominante...) (Mandonnet
etal,
1992;
Elsen,
1992).
L’introgression
d’ungène
«exotique»
peut
ainsiprendre
diverses formes différant par leurrapidité
d’exécution et leur robustesse.UTILISATION DE L’INFORMATION ISSUE DU
MARQUAGE
MOLÉCULAIRE
La
disponibilité
croissante des marqueurs moléculairespermet
d’envisager
derecher-cher des
gènes
dont l’effet est sensiblement moinsimportant
et de lespositionner
surle
génome.
Ils’agit
tout d’abord decartographier
ces marqueurs sur legénome.
Cessélection assistée par marqueurs, aide à
l’introgression
degènes
identifiésstatisti-quement
ou parl’analyse
de liaisongénétique,
évaluation des distancesgénétiques
entre races,
gestion
des ressourcesgénétiques.
Cartographie génétique
Dans le cadre
végétal,
méthodes etlogiciels
existent pourcartographier
lesmar-queurs dans les schémas
simples,
rétrocroisement,
F
2
oulignées
recombinantes.Cependant,
2types
de situations n’ont pas encore reçu deréponse
tout à faitsatis-faisante,
au moins au niveau deslogiciels.
Ils’agit
des croisements concernant des arbres fruitiers ou forestiers car il nes’agit
pas de croisement entrelignées
pures, et duproblème
des cartes consensus, dontl’objectif
est d’utiliser simultanément l’in-formation issue deplusieurs
croisements.Mangin
et Goffinet(1993)
font lepoint
sur le
logiciel Join-Map,
destiné àrépondre
à ces 2questions,
et concluent à sonefficacité.
Plusieurs
grands
programmes decartographie génétique
ont débuté ou débutentpour les animaux
domestiques.
Desprojets
européens
(PIGMAP’
etBOVMAP)
ont été lancés pour les 2
espèces économiquement
majeures
que sont le porc et lebovin. En
parallèle,
des contributions à l’établissement des cartesgénétiques
desovins,
caprins,
poules
et chevaux sontégalement
mises enplace.
Cesprotocoles
utilisent des
«populations
de référence» dont la taille et la structuregénéalogiques
peuvent
êtreoptimisées
en vue d’une efficacité maximum du travail decartographie.
À
l’occasion de la mise enplace
du programmeBovmap,
une réflexion a été menéepour cette
optimisation
(Elsen
etal,
1992 et1994).
Le critère de choixpeut
reposersur un des
objectifs
importants
assignés
à ces cartesgénétiques,
qui
est l’aide à ladétection de
QTL.
Pour une même densité de marqueurs, lapuissance
de détectionde
QTL
seraplus
importante
si ces marqueurs sontrégulièrement répartis
lelong
dugénome,
et donc choisis àpartir
d’une connaissanceprécise
de leurspositions.
Cesauteurs
proposent
ainsi de dimensionner lapopulation
de référence de telle sorte quela carte de marqueurs résultant de ce choix
permette,
pour unepuissance donnée,
de mettre en évidence des
QTL
avec le minimum d’effort(nombre
d’individus à mesurer dans unprotocole
de détection deQTL
utilisant la cartegénétique
enquestion).
La structure de la
population
de référence est déterminée par des choixportant
sur le nombre de
générations
et de descendants parreproducteur
et sur les animauxdont il faut déterminer les
génotypes.
En se basant sur un critère de varianceminimale,
Elsen et al(1993)
montrentqu’il
n’est pasindispensable
detyper
lagénération grand-parentale,
que les familles depleins-frères
sont de loinpréférables
aux familles de demi-frères
et,
qu’à
nombre total d’observationsdonné,
letypage
des
conjointes
n’est pasplus
efficace que le doublement du nombre de descendants par mâle.Mise en évidence de
QTL
La référence à Neimann-Sorensen et Robertson
(1961)
et Sax(1923)
relativise lecaractère novateur de la
«génétique»
moderne. Cequi
estchangé,
ce n’est pasla découverte de
techniques
de mise en évidence depolymorphismes
de l’ADNqui
rendent cette recherche
pratique
etprobablement
garantissent
son succès.De la même
façon
que dans les tests de détection degènes
majeurs,
les méthodesde référence sont basées sur le maximum de
vraisemblance,
comme lacartographie
par intervalle
(interval
mapping)
de Lander et Botstein(1989)
qui
estdéveloppée
pour des situationsexpérimentales simples
(lignées
consanguines, rétrocroisement,
F
2
).
On rencontre des difficultés du mêmetype
que pour la détection degènes
majeurs
pour déterminer la distribution desstatistiques
detests,
avec enparticulier
l’apparition
d’unparamètre
deposition
sur legénome
qui
pose desproblèmes
très délicats.De nombreuses méthodes alternatives
sont
développées
dans les cadres animauxet
végétaux
defaçon
àpouvoir
traiter des modèlesplus
complexes
(plusieurs
QTL
par
exemple),
àpermettre
des calculsplus simples
pour traiter des situationsexpérimentales complexes,
et à offrirplus
de robustesse auxhypothèses.
Les
problèmes statistiques généraux
Le
paramètre
deposition
duQTL
sur legénome disparaît
sousl’hypothèse
nulled’absence de
QTL.
Il n’est donc paspossible
d’utiliser les résultatsasymptotiques
classiques.
Rebaï et al(1993)
proposent
d’utiliser la méthode de Davies(1977)
pour déterminer le seuil du test du
rapport
de vraisemblance et sapuissance.
Lessimulations montrent un bon accord avec les résultats
théoriques.
Ce travailpermet
de
plus
de montrerl’équivalence
asymptotique
du test derapport
de vraisemblanceavec les tests linéarisés de
Knapp
et al(1990),
qui
sontplus simples
à calculer et àgénéraliser
à des situationscomplexes : multi-QTL,
croisementdiallèle,
etc.D’autre
part,
on est confronté au caractère nondéfini-positif
de la matriced’in-formation,
comme dans les tests de détection degène
majeur,
lorsque
l’on introduit desparamètres
de dominance duQTL
avec des marqueurs dominants.Mangin
etal
(1993b)
obtiennent la distribution desstatistiques
sousl’hypothèse
nulle et sousdes alternatives
locales,
en utilisant desdéveloppements
de la vraisemblance à desordres très élevés.
Les situations animales
Les méthodes
statistiques
lesplus développées
pour mettre en évidence cesQTL
sont basées sur le
test,
dans un cadrelinéaire,
des effets des allèles marqueursintrapère
ougrand-père
(Soller
etGenizi,
1978;
Weller etal,
1990).
Foulley
(1991)
propose une formule alternative de calcul direct de lapuissance
de détection d’unQTL
associé à un marqueur, pour lesdispositifs
de contrôles de descendance demâles des
première
(Soller
etGenizi,
1978),
ou de deuxièmegénération
(Weller
etal,
1990).
Cette formule repose sur uneapproximation asymptotique
(grand
nombred’allèles au
QTL)
etsuppose,
comme le font Fernando et Grossman(1989),
quel’effet du
gène
auQTL
transmis par lepère
chez un de ses descendantsquelconque
soit une variable aléatoire.
En se limitant au test d’une
simple
héréditémonogénique
liée au marqueurdis-ponible,
LeRoy
et Elsen(1992,
1993)
évaluent legain
depuissance
apporté
pardifférences de forme de distribution du caractère
quantitatif
chez les descendants d’unpère
doublementhétérozygote
(au
locus marqueur et au locusquantitatif)
se-lon l’allèle marqueur reçu du
père,
et non seulement les différences dansl’espérance
de ces distributions. Ce
gain
peut
êtreimportant
dans le cas deQTL
à faibleeffet,
faiblement liés au locus marqueur et pour des tailles limitées de
population
(gain
de
50%
pour unQTL
dominant dont l’effet est de0,2
écarttype,
etqui
est situé à10%
de recombinaison du marqueur, en utilisant unepopulation
de 5grand-pères,
100
pères/grand-père
et 100descendants/père).
Cette étude montreégalement
que, dans ces situations où un seulQTL
contrôle lecaractère,
legain
apporté
par lesmarqueurs par
rapport
àl’analyse
deségrégation
classique
est faible. Cette étude est maintenantprolongée
par un travailéquivalent
dans le cas d’une hérédité mixtecombinant
unQTL
lié au marqueur étudié et un ensemble d’autresgènes
indépen-dants.
En
pratique,
la recherche deQTL
se fera àpartir
d’une carte de marqueurs.Or,
pour un mêmeindividu,
un locus marqueurpeut
ne pas être informatifquand
deslocus voisins le sont. Les informations
apportées
par tous les marqueursprésents
dans une zone du
génome
doivent donc être simultanément utilisées. Nous nous sommesplacés
dans le casparticulier
du croisementF
I
etF
2
entre
2lignées
extrêmes dupoint
de vuequantitatif
(QTL
fixés à l’étathomozygote
dans les racespures),
mais où les allèles aux locus marqueurs sont enségrégation.
Ils’agit
vraisemblablement de la situation
qui
prévaudra
pour la détection deQTL
chez le porc àpartir
de croisements entre une raceeuropéenne
(Large White)
et une race chinoise(Meishan).
Dans cecontexte,
Haley
et al(1994)
ontdéveloppé
unalgorithme
exact dans le cas de marqueurscodominants,
sans donnéesmanquantes,
pour le traitement simultané de tous les marqueurs d’un même groupe de liaison.
Son évaluation par simulation
indique
que cettetechnique
estplus
puissante
et robuste quel’analyse
uni marqueur.Il est intéressant par ailleurs de rechercher des méthodes
plus simples
à calculer etplus
robustes auxhypothèses
de normalité des distributions. La méthode de Ha-seman et Elston(1972)
HE basée sur lescouples
degermains,
offre cesavantages
(Blackwelder
etElston,
1982),
mais est encontrepartie
peupuissante.
Avec desmarqueurs hautement
polymorphes,
l’utilisation exclusived’accouplements
totale-ment informatifs
peut
êtreenvisagée.
Gôtz et Ollivier(1992)
ontétudié,
à l’aide desimulations,
l’effet d’unsystème génétique
hautementpolymorphe
(5
allèleséga-lement
fréquents),
d’unegrande
taille de fratrie(6 germains)
et d’une structured’élevage polygynique
(25
femellesaccouplées
àchaque
mâle)
sur lapuissance
dutest HE. Les résultats montrent que la
puissance
estconsidérablement
accruequand
ondispose
à la fois de marqueurs hautementpolymorphes
et degrandes
fratries. Avec un nombre total d’individustypés
de5000,
et pour un locusexpliquant
8%
de la variance
phénotypique
ducaractère,
lapuissance
du test au niveau5%
est de0,74
au lieu de0,14
quand
on passe de 2 à 5 allèles au locus marqueur, et de 2 à 6frères par fratrie.
Les situations
végétales
La
plupart
des méthodes de recherche deQTL
(Lander
etBotstein,
1989;
Knapp
et
al,
1990)
sont fondées surl’hypothèse
que ceux-ci sont bienséparés
les unsdans son ensemble et recherché des
régions chromosomiques impliquées
dans la variation de caractèresquantitatifs
entre 2lignées
pures et leursproduits
decroisement.
Rodolphe
et Lefort(1993)
ontdéveloppé
une méthodeadaptée
auxF
2
,
rétrocroisements ethaploïdes
doublés. Les marqueurs doivent être codominants et les donnéesmanquantes
sont admises. Cetteméthode, qui
ne repose pas surdes
hypothèses génétiques
fortes,
doit être utilisée avec des densités de marquageraisonnables,
maisprésente l’avantage
deprendre
encompte
simultanément l’effetde tous les
QTL.
On doit donc en attendre une réduction de la variance résiduelledans le cas où coexistent
plusieurs QTL.
Uneperspective
intéressante seraitd’analyser
les données avec cetteméthode,
en conservant les marqueurs sur tous lesgroupes de liaison sauf un,
puis
analyser
les résidus avec une méthodeséquentielle
en conservant cette fois tous les marqueursdisponibles
sur le dernier groupe deliaison seulement.
Ces méthodes sont
adaptées
aux situationsexpérimentales
lesplus classiques.
Si l’on cherche à étudier la stabilité d’un
QTL
dans différents fondsgénétiques,
il est intéressant d’utiliser un croisement diallèle avecplusieurs lignées.
Rebaï et Goffinet(1993)
ont étudié lapuissance
de différents tests de détection deQTL
dans ce
cadre,
pour des observations faites sur destopcross
ouF
3
.
Ilapparaît
queles tests
qui
utilisent l’informationconjointe
des différents croisements du diallèlesont sensiblement
plus
puissants
que les testsclassiques,
etqu’il
estpréférable
dene pas
intégrer
de terme de dominance dans le modèle. Ce travail sepoursuit
parla mise au
point
d’une méthode decartographie
par intervalle dans ce cadre.Utilisation des marqueurs pour l’amélioration
génétique
La sélection assistée par marqueurs
peut
être basée sur l’utilisation d’undéséquilibre
de liaison entre ces marqueurs et des
QTL
(Lande,
Thompson,
1990),
ou sur le suivigénéalogique
desgénotypes
des candidats à lareproduction
(Le
Roy,
1992,
Elsen,
1992,
LeRoy
etElsen,
1992,
Boichard etal,
1993).
Dans lepremier
cas ilest à craindre que le
déséquilibre s’estompe
au cours desgénérations,
après
sonapparition
à la suite d’un croisement ou d’unemutation,
et ceci d’autantplus
quela liaison
marqueur-QTL
est faible. Dans le second cas il convient de mettre enplace
un suiviprécis
desperformances
et desgénotypes
marqueurs des individus dela
population
afin d’estimer lesgénotypes
au(x) QTL(s)
et depiéger
le cas échéantles événements de recombinaison.
L’apport
des marqueurs pourl’introgression
desgènes
estbeaucoup plus
immédiat. D’unepart,
ilpermet
d’identifierrapidement,
dès lanaissance,
surn’im-porte
quel individu,
mâle oufemelle,
songénotype
au locus faisantl’objet
del’intro-gression
(Hospital
etElsen,
1992).
D’autrepart,
ilpermet
d’accélérer le processus de restauration dugénome
de la race ou de la variété receveuse en utilisantl’in-formation
apportée
par lesgénotypes
enplusieurs
marqueursdisposés
lelong
dugénome,
les individus retenus étant ceuxqui
ont laproportion
maximum d’allèlesspécifiques
de la race ou de la variété receveuse.Hospital
et al(1992)
ont étudié leseffets de la durée et de l’intensité de la
sélection,
de la taille de lapopulation,
dunombre et de la
position
des marqueurs sélectionnés sur les chromosomesportant
ou neportant
pas legène introgressé.
Ils montrent que l’utilisation de marqueursdonnées par Hillel et al
(1990).
Les marqueurs sontplus
utileslorsque
leurposi-tion est connue. Ils montrent que dans les
premières générations,
il ne sert à riend’utiliser
plus
de 3 marqueurs pourchaque
chromosome nonporteur.
Concernantle chromosome
porteur,
ilapparaît qu’il
estpréférable
detyper
relativement peud’individus pour de nombreux marqueurs
plutôt
que de nombreux individus pourquelques
marqueursproches
dugène.
Ce travail fournit les bases de raisonnementnécessaires à la définition d’une
stratégie optimale
de sélectionadaptée
àchaque
cas
particulier.
Enfin,
les marqueurspermettent
de définir des indices de distancegénétique
entrelignées.
Charcosset et al(1991)
ont étudié la corrélation p entre un index de cetype
défini pour 2
lignées parentales
et l’hétérosis observé dans laF
I
issue de ceslignées,
pour un caractère
quantitatif.
Les calculsthéoriques
de cette corrélation sont faitsen utilisant un modèle
biallélique.
Lorsque
les allèles au locus marqueur et auQTL
sont
également
distribués à l’intérieur de lapopulation
deslignées
considérées,
lecoefficient p est une fonction des carrés des
déséquilibres
de liaison entre les allèles au locus marqueur et les allèles auQTL.
LesQTL
qui
ne sont pasmarqués
par un locus marqueur, et les marqueursqui
ne sont pas liés à unQTL,
jouent
un rôlesymétrique
etpeuvent
faire décroître p de manièreimportante.
Enconclusion,
laprédiction
de l’hétérosis d’unhybride
F
i
àpartir
de marqueurs seraitplus
efficacesi ces marqueurs étaient sélectionnés sur leurs liaisons avec les
QTL.
Ce mêmetype
de modèle est utilisé par Charcosset et Essioux
(1993)
pour étudier l’effet sur lecoefficient p de la structuration des
lignées
en groupeshétérotiques.
Ilapparaît
quel’on trouvera des valeurs
significatives
de p si leslignées appartiennent
à un mêmegroupe
hétérotique,
mais que l’on ne trouvera aucune relation pour deshybrides
entre
lignées
appartenant
à des groupesdifférents,
car ledéséquilibre
de liaison variede manière
aléatoire
d’un groupe à l’autre. Ces résultats sont cohérents avec lesrésultats
expérimentaux
etsoulignent
la nécessité de mettre aupoint
de nouveauxmodèles de
prédiction
pour mieux valoriser l’information.Perspectives
La
disponibilité
croissante de marqueurs moléculaires ne fait pasdisparaître
l’intérêt de détecter et d’utiliser desgènes majeurs
àpartir
des seules informationsphénoty-piques
etgénéalogiques.
Il existe en effet ungrand
nombre de donnéesphénotypi-ques non encore
exploitées
et le marquage reste relativement coûteux. Il reste donc intéressant de travailler sur lesaspects
méthodologiques
du traitement de tellesdonnées, qui
enplus
de l’intérêt propre desméthodes,
sont souvent un passageobligé
avant de traiter deproblèmes plus
compliqués
impliquant
des marqueurs.Les
aspects
prioritaires
semblent être le traitement depedigrees
complexes
et la recherche de robustesse.Les
problèmes méthodologiques
concernant l’utilisation des marqueurs restent trèsimportants
et de nouveauxproblèmes
voient lejour
au fur et à mesure que sedéveloppent
des nouvellespistes
d’utilisation des marqueurs en sélection :-
cartographie :
il fautdévelopper
desalgorithmes
de calcul efficaces pour lespedigrees
animaux et proposer desalgorithmes
et des tests pour déterminer- recherche de
QTL :
il reste encore de nombreuxproblèmes
statistiques
nonparfaitement résolus,
comme l’intervalle de confiance de laposition
desQTL
ou le test de l’existence deplusieurs QTL ;
-
par ailleurs il faut
développer
desalgorithmes
et deslogiciels
pour traiterdes situations
animales;
laparticipation
à un réseaueuropéen
en cours deconstitution devrait
permettre
d’accélérer les travaux dans cettedirection;
- utilisation
en sélection :
beaucoup
de choses restent à faire dans la mise aupoint
de méthodes et critères de sélection assistée par marqueurs et de construction de
génotypes
associant un ensemble deQTL
favorables.REMERCIEMENTS
Nous tenons à remercier l’AIP INRA
Agrotech-Prodige, qui
est àl’origine
de la création du groupe MMM etqui
en a assuré le financement de mai 1990 à mai 1993.RÉFÉRENCES
Blackwelder
WC,
Elston RC(1982)
Power and robustness ofsib-pair linkage
testsand extension to
larger sibships.
Commun Statist-Theor Methods11,
449-484Boichard
D,
ChevaletC,
LeRoy
P,
Elsen JM(1993)
Lesperspectives
d’utilisationdes marqueurs
génétiques
chez les animauxdomestiques.
Réunion de l’AFZ.Nantes,
25-26 mai 1993
Boichard
D,
ElsenJM,
LeRoy
P,
Bonaiti B(1990)
Segregation analysis
of fatcontent data in Holstein x
European
Friesian crossbred cattle. In : Proc FourthWorld
Congr
GenetAppl
Livest Prod(Hill,
Thompson,
Wooliams,
eds),
XIV,
167-170
Charcosset
A,
Essioux L(1994)
The effect ofgermplasm
structuration on therelationship
between heterosis andheterozygosity
at marker loci. TheorAppl
Genet(à
paraître)
Charcosset
A,
LefortM,
Gallais A(1991)
Relationship
between heterosis andheterozygosity
at marker loci: a theoreticalcomputation.
TheorAppl
Genet81,
571-575
Davies RB
(1977)
Hypothesis
testing
when a nuisanceparameter
ispresent
only
under the alternative. Biom.etrika
64,
247-254Duchet-Suchaux
M,
MenateauP,
Le RouxH,
ElsenJM,
Lechopier
P(1992)
Geneticcontrol of resistance to
enterotoxigenic
Escherichia coli in infant mice. MicrobPathogen
13,
157-160Elsen JM
(1992)
What should beexpected
frommajor
genes forreproduction
insheep ? Symposium &dquo;Perspektiven
derNutztierwissenschaften&dquo;,
Anliissllich des 65.Geburtstages
von Prof Dr RWassmuth, Giessen,
9 Màrz 1993Elsen
JM,
LeRoy
P,
Goffinet B(1991)
Comparison
of fourstatistical
tests forgenotype
determination at amajor
locus of progeny tested sires. J Anirn BreedGenet
108, 167-173
Elsen
JM,
Mangin
B,
GoffinetB,
Chevalet C(1992)
Protocoldesigns
forbuilding
genetic
linkage
map in livestock. 43e Réunion annuelle de laFEZ,
Commission deElsen
JM, Mangin B,
GoffinetB,
Chevalet C(1994)
Optimal
structure ofprotocol
designs
forbuilding
genetic
linkage
map in livestock. TheorAppl
Genet(À
paraître)
Fain PR
(1978)
Characteristics ofsimple sibship
variance tests for the detectionof
major
loci andapplication
toheight, weight
andspatial performance.
Ann HumGenet
42,
109-120Fernando
R,
Grossman M(1989)
Best linear unbiasedprediction
and markerassisted selection. Genet Sel
Evol 21,
467-477Foulley
JL(1991)
Exposé critique
desdispositifs
«filles» et«petites
filles»proposés
par Weller et
al, 1990,
pour la mise en évidence desQTL.
Rapport
interneINRA,
Domaine de
Vilvert,
78352Jouy-en-Josas
CedexGoffinet
B,
ElsenJM,
LeRoy
P(1990)
Statistical tests for identification of thegenotype
at amajor
locus of progeny tested sires. Biometrics46,
583-594Goffinet
B,
LoiselP,
Laurent B(1992)
Testing
in normal mixture models when theproportion
are known. Biorrcetrika79,
842-846Gotz
KU,
Ollivier L(1992)
Theoreticalaspects
ofapplying sib-pair linkage
tests tolivestock
species.
Genet Sel Evol24,
29-42Haley CS,
KnottSA,
Eisen JM(1994)
Mapping
quantitative
trait loci in crossesbetween outbred lines
using
least squares. Genetics(à
paraître)
Haseman
JK,
Elston RC(1972)
Theinvestigation
oflinkage
between aquantitative
trait and a marker locus. Behav Genet
1,
3-19Hillel
J,
Schaap
T,
Haberfeld A et al(1990)
DNAfingerprint applied
to geneintrogression
breeding
programs. Genetics124,
783-789Hospital
F,
ChevaletC,
Mulsant P(1992)
Using
markers in geneintrogression
breeding
programs. Genetics132,
1199-1210Hospital
F,
Elsen JM(1992)
Introgression génique
assistée par marqueurs. INRA Prod Anim Hors série «Eléments degénétique
quantitative
etapplication
auxpopulations animales»,
299-302Knapp
SJ,
Bridges
WC,
Birkes D(1990)
Mapping
quantitative
trait lociusing
molecular markerlinkage
maps. TheorAppl
Genet79,
583-592Lalouel
JM,
RaoDC,
MortonNE ,
Elston RC(1983)
A unified model forcomplex
segregation analysis.
Am J Hum Genet35,
816-826Lande
R, Thompson
R(1990)
Efficiency
of marker assisted selection in theimprovement
ofquantitative
traits. Genetics124,
743-756Lander
ES,
Botstein D(1989)
Mapping
mendelian factorsunderlying
quantitative
traits
using
RFLPlinkage
maps. Genetics121,
185-199Lemdani M
(1991)
Estimation du mode d’une densité unimodale par un critère deminimum de distance. DEA de
statistiques
et modèlesaléatoires,
Orsay
Le
Roy
P(1992)
Les méthodes de mise en évidence desgènes
majeurs.
INRA ProdAnim Hors série «Eléments de
génétique
quantitative
etapplication
auxpopulations
animales»,
93-99Le
Roy P,
Elsen JM(1992a)
Simple
test statistics formajor
gene detection: anumerical
comparison.
TheorAppl
Genet83,
635-644Le
Roy
P,
Elsen JM(1992b)
Numericalcomparison
between maximum likelihood andanalysis
of variance methods forQTL
detection in progeny testdesigns.
43e Réunion annuelle de laFEZ,
14-17septembre
1992,
MadridLe
Roy
P,
Elsen JM(1993)
Numericalcomparison
between maximum likelihood andanalysis
of variance methods forQTL
detection in progeny testdesigns. Monogenic
inheritance. Theor
Appl
Genet(à paraître)
Le
Roy
P,
NaveauJ,
ElsenJM,
Sellier P(1990)
Evidence for a newmajor
geneinfluencing
meatquality
inpigs.
Genet Res Camb55,
33-40Loisel
P,
GoffinetB,
MonodH,
Montes de Occa G(1993)
Detecting major
gene inan F2
population.
Biometrics(à
paraître)
Mandonnet
N,
LeRoy P,
CaritezJC,
EisenJM,
Legault
C,
Bidanel JP(1992)
Existe-t-il un
gène
à effetmajeur expliquant
laprolificité exceptionnelle
de la race Meishan? 43e réunion annuelle de laFEZ,
14-18septembre
1992,
Madrid,
Commission de
génétique
animale,
Abstract : vol1,
126-127Mangin
B,
Goffinet B(1993)
Comparaison
delogiciels
pour l’obtention de cartesconsensus.
Rapport
interneINRA,
Auzeville,
31326 Castanet-TolosanMangin
B,
GoffinetB,
Eisen JM(1993a)
Testing
in normal mixture models withsome information on the
parameter.
Biometrical J(à paraître)
Mangin B,
GoffinetB,
Rebaï A(1993b)
QTL
detection and dominant markers.Rapport
interne,
INRA,
Auzeville,
31326 Castanet-TolosanNeimann-Sorensen
A,
Robertson A(1961)
The association between blood groups and severalproduction
characteristics in three Danish cattle breeds. ActaAgr
Scand11,
163-196Pons 0
(1993)
Homogeneity
test in distribution mixtures andapplication
tomajor
genes detection. Statistics
24,
149-160Rebaï
A,
Goffinet B(1993)
Power of different tests forQTL
detectionusing
progenies
derived from a diallel cross. TheorAppl
Genet86,
1014-1022Rebaï
A,
GoffinetB,
Mangin
B(1993)
Comparing
power of different methods forQTL
detection. Biometrics(à paraître)
Rodolphe
F,
Lefort M(1993)
A multi-marker model fordetecting
chromosomalsegments
displaying QTL
activity.
Genetics134,
1277-1288Sax K
(1923)
Association of size differences with seed-coatpattern
andpigmenta-tion in Phaseolus
vulgaris.
Genetics8,
552-560Soller
M,
Genizi A(1978)
Theefficiency
ofexperimental designs
for the detection oflinkage
between a marker locus and a locusaffecting
aquantitative
trait insegregating populations.
Biometrics34,
7-55Weller
JL,
KashiY,
Soller M(1990)
Powerof daughter
andgranddaughter designs
for