• Aucun résultat trouvé

Utilisation des marqueurs moléculaires en génétique animale

N/A
N/A
Protected

Academic year: 2021

Partager "Utilisation des marqueurs moléculaires en génétique animale"

Copied!
15
0
0

Texte intégral

(1)

HAL Id: hal-02697433

https://hal.inrae.fr/hal-02697433

Submitted on 1 Jun 2020

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Didier Boichard, Pascale Le Roy, Hubert Levéziel, Jean Michel Elsen

To cite this version:

Didier Boichard, Pascale Le Roy, Hubert Levéziel, Jean Michel Elsen. Utilisation des mar- queurs moléculaires en génétique animale. Productions animales, Institut National de la Recherche Agronomique, 1998, 11 (1), pp.67-80. �hal-02697433�

(2)

et AppliquŽe, 78352 Jouy-en-Josas Cedex

* INRA, Laboratoire de GŽnŽtique Biochimique et de CytogŽnŽtique, 78352 Jouy-en-Josas Cedex

** INRA, Station dÕAmŽlioration GŽnŽtique des Animaux, BP 27, 31326 Castanet Cedex

des marqueurs molŽculaires en gŽnŽtique animale

Les marqueurs sont des fragments dÕADN qui servent de rep•res pour suivre la transmission dÕun segment de chromosome dÕune gŽnŽration ˆ lÕautre. Ils sont notamment utilisŽs pour rechercher les g•nes qui gouvernent les caract•res dÕintŽr•t zootechnique, mais ils peuvent aussi servir, par exemple, ˆ maintenir la variabilitŽ gŽnŽtique des petites populations. LÕarticle rappelle dÕabord les notions ˆ la base du concept de marqueur puis prŽsente les diffŽrentes utilisations actuelles et potentielles.

RŽsumŽ

Gr‰ce aux progr•s rŽcents de la biologie molŽculaire, en particulier la dŽcouverte des sŽquences microsatellites et la technique dÕamplification des sŽquences dÕADN par PCR, de nombreux marqueurs gŽnŽtiques sont maintenant disponibles et organisŽs en cartes gŽnŽtiques dans la plupart des esp•ces dÕŽlevage. Cet article prŽsente dÕabord les principales propriŽtŽs des marqueurs gŽnŽtiques, en particu- lier le polymorphisme et la liaison, qui permettent dÕidentifier et de suivre des segments chromosomiques entre gŽnŽrations. Il dŽcrit ensuite les principales applications possibles des marqueurs dans la gestion des populations et lÕanalyse de leur variabilitŽ gŽnŽtique, et il met lÕaccent sur lÕapplication la plus dŽveloppŽe ˆ lÕheure actuelle, la dŽtection des principales rŽgions chromosomiques (ou QTL) impliquŽes dans le dŽterminisme des caract•res dÕintŽr•t Žconomique, prŽlimi- naire indispensable ˆ leur utilisation par sŽlection assistŽe par marqueurs ou introgression. Enfin, cet article prŽsente succinctement les mŽthodes, en particu- lier celles basŽes sur la cartographie comparŽe, pour passer des marqueurs aux g•nes responsables de la variabilitŽ gŽnŽtique des caract•res dÕintŽr•t, ouvrant ainsi la voie ˆ une meilleure comprŽhension des mŽcanismes impliquŽs et ˆ une utilisation plus facile et plus gŽnŽralisable des rŽsultats.

Bien que les lois de Mendel dŽcrivant la transmission des g•nes entre gŽnŽrations soient connues depuis longtemps, il nÕest gŽnŽralement pas possible de les vŽrifier sur les caract•res Žconomiquement importants.

Quelques g•nes ˆ effet majeur, comme le g•ne de sensibilitŽ ˆ lÕhalothane chez le porc, le g•ne culard chez le bovin, le g•ne Booroola chez les ovins, le g•ne de la casŽine αs1chez la ch•vre ou le g•ne de nanisme de la poule constituent pour lÕinstant des exceptions. En gŽnŽral, au niveau dÕune population comme intra descendance, les caract•res dÕintŽr•t prŽsentent souvent une distribution continue, dans laquelle il nÕest pas possible de distin- guer un nombre fini de gŽnotypes. Ceci sÕex- plique par le fait que ces caract•res sont sou- mis ˆ des effets de milieu, aux effets de

plusieurs g•nes, et Žventuellement ˆ leurs interactions. Pour analyser ces donnŽes et sŽlectionner les populations, un mod•le a ŽtŽ dŽveloppŽ initialement par des mathŽmati- ciens. Ce mod•le, dit infinitŽsimal, suppose que le caract•re est soumis de fa•on additive ˆ des effets de milieu et aux effets dÕun nombre infini de g•nes, non identifiables isolŽment.

Ce mod•le nÕa pas pour but dÕexpliquer le dŽterminisme gŽnŽtique des caract•res mais de prŽdire certains param•tres comme le degrŽ de ressemblance entre apparentŽs, la supŽrioritŽ gŽnŽtique transmissible dÕun reproducteur, ou le progr•s gŽnŽtique rŽali- sable par sŽlection, ˆ partir de deux types dÕinformation, les observations du caract•re (ou phŽnotype) et les gŽnŽalogies. CÕest lÕoutil de base en amŽlioration gŽnŽtique. Le fait que ce mod•le infinitŽsimal, vŽritable bo”te noire mathŽmatique, soit opŽrationnel et perfor- mant ne signifie en aucune fa•on quÕil est cor- rect mais plut™t quÕil est robuste envers une rŽalitŽ sans doute tr•s diffŽrente. Toutefois, bien que les g•nes agissant sur les caract•res dÕintŽr•t restent en gŽnŽral mŽconnus, faute de pouvoir les mettre en Žvidence individuel- lement, on peut cependant supposer que leurs effets individuels, pour certains dÕentre eux, peuvent •tre importants.

Gr‰ce aux progr•s rŽcents et spectaculaires de la gŽnŽtique molŽculaire qui ont permis, entre autres, la construction de cartes gŽnŽ- tiques dans diffŽrentes esp•ces animales, lÕidentification de ces g•nes peut •tre abordŽe.

Cet article prŽsente les perspectives offertes dans lÕŽtude analytique des caract•res et les procŽdures de sŽlection et de gestion des populations.

(3)

un codon = 3 bases

}

un acide aminé Transcription L'ADN est organisé en chromosomes.

L'ensemble des chromosomes constitue le génome.

Chromosome au stade métaphase de la méiose.

ARN messager

Au cours de la deuxième phase, l'ARN messager est "traduit" en protéines : à chaque triplet (ou codon) de nucléotides correspond un acide aminé.

La traduction est initiée par une séquence particulière de nucléotides, puis elle démarre au premier triplet qui code pour le premier acide aminé de la protéine. Elle se poursuit ensuite jusqu'à un signal "stop" (codon UAA, UAG ou UGA).

La molécule d'ADN se présente sous forme d'une hélice à deux brins.

Chaque brin est constitué de

l'enchaînement de 4 éléments de base appelés nucléotides. Ces 4 nucléotides diffèrent par les bases azotées qui les constituent : A, C, G ou T .

Les enchaînements des nucléotides sur les deux brins sont

complémentaires (bases C avec G, T avec A).

Un gène est une portion de la molécule d'ADN.

Il se définit par la séquence des nucléotides.

Les gènes sont la partie codante du génome, c'est-à-dire les portions du génome qui seront traduites en protéines. Les gènes ne représentent que 5 à 10 % du génome.

La synthèse des protéines se déroule en deux phases.

Au cours de la première, l'ADN est "transcrit" en ARNmessager (les bases utilisées sont les mêmes que dans l'ADN sauf U à la place de T).

A un emplacement (= locus) donné du génome, c'est-à-dire pour un segment d'ADN donné, que ce soit ou non un gène, la séquence des nucléotides peut varier d'un individu à l'autre. Cette variabilité définit le polymorphisme génétique, les différentes séquences au locus étant dites allèles.

A T A T

C G C G

A T

C G A T

G C

A T

C G A

T C G

A T A T

C G

C G U

T A C G A U G C

A G C

U C C

A A

U G

A

Illustration M-H Farce

(4)

1 / DŽfinition et propriŽtŽs des marqueurs

1.1 / Rappels

LÕinformation gŽnŽtique est stockŽe dans chaque cellule sous la forme de longues molŽ- cules dÕacide dŽsoxyribonuclŽique (ADN) constituant le gŽnome. LÕADN est constituŽ de lÕencha”nement prŽcis de quatre ŽlŽments de base, les nuclŽotides, notŽs A, C, G et T (voir encadrŽ ci-contre). Les g•nes correspondent ˆ la partie codante du gŽnome, cÕest-ˆ-dire la partie traduite sous forme de protŽines, qui globalement ne correspond quÕˆ une faible part du gŽnome (5 ˆ 10 %). LÕADN est organisŽ en chromosomes. Chez les esp•ces diplo•des, et en particulier les esp•ces dÕŽlevage, lÕinforma- tion gŽnŽtique est contenue dans 2n chromo- somes rŽpartis en n paires de chromosomes homologues, chacun des chromosomes de chaque paire provenant de chaque parent.

a / Polymorphisme

LÕanalyse de la sŽquence nuclŽotidique dÕun segment dÕADN (Ç sŽquen•age È) ˆ un locus donnŽ, cÕest-ˆ-dire ˆ un emplacement donnŽ sur le gŽnome (quÕil sÕagisse dÕun g•ne ou non) et dans une population donnŽe, peut montrer certaines variations. Les diffŽrentes formes ˆ un locus sont dites all•les. LÕexistence de dif- fŽrents all•les possibles ˆ un locus dŽfinit le polymorphisme gŽnŽtique. En pratique, le polymorphisme peut •tre mis en Žvidence par diffŽrentes techniques, gŽnŽralement plus simples et plus lŽg•res que le sŽquen•age. Un individu portant deux fois le m•me all•le ˆ un locus est dit homozygote, tandis quÕun indi- vidu portant deux all•les diffŽrents est dit hŽtŽrozygote. Seule une petite partie de cette variabilitŽ gŽnŽtique au niveau de lÕADN se traduit par une variabilitŽ des performances.

b / Liaison

Lors de la mŽiose, le gŽnome dÕun gam•te est constituŽ en tirant au hasard un chromo- some dans chaque paire du parent. Il en rŽsulte que deux g•nes situŽs sur les chromo- somes de deux paires diffŽrentes sont toujours transmis indŽpendamment lÕun de lÕautre.

Pour deux g•nes appartenant ˆ une m•me paire de chromosomes homologues, on constate que sÕils sont situŽs sur le m•me chromosome, ils ont tendance ˆ •tre transmis ensemble, tandis que si ces g•nes sont situŽs sur les deux chromosomes homologues de la paire, ils ne sont gŽnŽralement pas transmis ensemble. Cette r•gle est mise en dŽfaut par lÕexistence dÕŽchanges de matŽriel entre chro- mosomes homologues, appelŽs crossing-over.

Ainsi, deux g•nes situŽs initialement sur le m•me chromosome peuvent se retrouver sur les deux chromosomes homologues en cas de crossing-over. On dit quÕil y a recombinaison.

La frŽquence de recombinaison est surtout fonction de la distance entre les locus. Deux locus proches recombinent peu et ont donc

tendance ˆ •tre transmis ensemble, tandis que deux locus tr•s ŽloignŽs sur le m•me chro- mosome se comportent comme deux locus indŽpendants. Le taux de recombinaison entre deux locus est dÕailleurs la mŽthode de mesure la plus courante et la plus ancienne de la distance entre deux g•nes, dite distance gŽnŽtique. En moyenne, chez les mammif•res domestiques, 1 % de recombinaison entre deux locus correspond ˆ une distance phy- sique dÕun million de bases entre ces deux locus, la taille du gŽnome Žtant de lÕordre de 3 milliards de paires de bases.

1.2 / Concept de marqueur

Polymorphisme et liaison sont ˆ la base de la dŽfinition de la notion de marqueur.

a / Polymorphisme

Le polymorphisme permet dÕŽtablir lÕorigine parentale de lÕall•le ˆ un locus donnŽ. Ainsi, si un all•le portŽ par un individu est portŽ par son p•re mais pas par sa m•re, lÕindividu lÕa re•u de son p•re. On peut donc distinguer les chromosomes re•us du p•re et de la m•re.

Un all•le marqueur ne permet de suivre un segment chromosomique que sÕil peut •tre dis- tinguŽ des autres all•les. Intra population, un marqueur nÕest m•me utile que sÕil est poly- morphe intra reproducteur, autrement dit que si le reproducteur est hŽtŽrozygote au mar- queur. En effet, chez un reproducteur homozy- gote, le marqueur nÕest pas informatif pour distinguer deux types de gam•tes et donc deux types de descendants. Cependant, m•me ˆ lÕŽtat hŽtŽrozygote, un marqueur nÕest pas informatif ˆ 100 %. Ainsi, dans une famille o•

p•re, m•re et descendant sont M/m, le mar- queur nÕest pas informatif. DÕune fa•on gŽnŽ- rale, on mesure lÕinformativitŽ dÕun marqueur par son aptitude ˆ distinguer sans Žquivoque deux groupes de descendants selon lÕall•le marqueur re•u du parent. Le PIC (=polymor- phism information content) dÕun marqueur, qui varie de 0 ˆ 1, reprŽsente la proportion dÕindividus informatifs dans une population idŽale. Un marqueur codominant, cÕest-ˆ-dire pour lequel tous les all•les peuvent •tre dŽduits simplement de lÕobservation du phŽ- notype, est plus informatif quÕun marqueur dominant, dont lÕall•le rŽcessif nÕest obser- vable quÕˆ lÕŽtat homozygote. DÕautre part, un marqueur est dÕautant plus informatif que le nombre dÕall•les est ŽlevŽ et que leurs frŽ- quences sont ŽquilibrŽes. Ces considŽrations expliquent pourquoi les gŽnŽticiens recher- chent des marqueurs codominants tr•s poly- morphes. Pour augmenter lÕinformativitŽ, une alternative consiste ˆ considŽrer un groupe de marqueurs tr•s liŽs comme un marqueur unique, appelŽ haplotype, dont le polymor- phisme rŽsulte de toutes les combinaisons allŽliques de chaque marqueur ŽlŽmentaire.

b / Liaison(figure 1)

La liaison gŽnŽtique permet de gŽnŽraliser les conclusions des observations sur un locus

(5)

particulier ˆ lÕensemble du segment dÕADN entourant ce locus : comme il nÕy a pas de recombinaison entre le locus observŽ et le seg- ment qui lÕentoure, ce locus devient un mar- queur de ce segment et de tous les g•nes quÕil contient.

Le marquage est dÕautant plus efficace que le segment considŽrŽ est court, ce qui limite le taux de recombinaison entre le marqueur et le g•ne. En pratique, dans de nombreuses appli- cations, la distance recherchŽe entre mar- queur et g•ne ne dŽpasse pas 20 cM. La taille du gŽnome Žtant dÕenviron 3000 cM, 150 mar- queurs bien placŽs constituent donc un maillage thŽoriquement suffisant des 100 000 g•nes qui constituent le patrimoine gŽnŽtique dÕune esp•ce animale. Avant toute utilisation systŽmatique de marqueurs, il convient donc de les localiser les uns par rapport aux autres sur une carte gŽnŽtique et de vŽrifier que le gŽnome est totalement couvert.

c / DŽsŽquilibre de liaison

Deux locus sont en Žquilibre de liaison si dans lÕensemble des gam•tes de la population considŽrŽe et pour tout all•le M et tout all•le Q ˆ ces deux locus, la frŽquence de lÕhaplotype

MQ est Žgale au produit des frŽquences des all•les M et Q. Dans ce cas, la connaissance de lÕall•le ˆ un locus ne permet pas de prŽdire lÕall•le ˆ lÕautre locus. Au contraire, on parle de dŽsŽquilibre de liaison sÕil existe des asso- ciations prŽfŽrentielles entre les all•les des deux locus. Un dŽsŽquilibre de liaison est gŽnŽralement dž ˆ lÕexistence dÕune liaison.

Toutefois, lÕexistence dÕune liaison gŽnŽtique nÕimplique pas un dŽsŽquilibre de liaison.

Dans une population fermŽe de grande taille, on consid•re lÕŽquilibre de liaison comme lÕhy- poth•se la plus gŽnŽrale. En effet, tout dŽsŽ- quilibre apparu par migration, mutation, sŽlection ou dŽrive gŽnŽtique, est progressive- ment dŽtruit par les recombinaisons au cours des gŽnŽrations. Un dŽsŽquilibre global au niveau de la population est donc instable et nÕexiste que si son origine est rŽcente et si les locus sont tr•s liŽs. Cette situation est assez dŽfavorable car elle rend le marquage plus difficile dÕutilisation. En effet, lÕassociation entre deux all•les de deux locus, dŽtectŽe sur un Žchantillon de la population, nÕest pas gŽnŽralisable ˆ lÕensemble de la population.

En pratique, deux situations peuvent exis- ter. Premi•re possibilitŽ, on crŽe un dŽsŽqui- libre, par exemple par croisement entre deux Un marqueur

dÕun g•ne est un segment dÕADN proche de ce g•ne et dont la sŽquence des nuclŽotides peut varier dÕun individu ˆ lÕautre.

Si on considère un locus très proche du locus du gène A , la probabilité de recombinaison entre les deux locus est très faible : ils seront transmis ensemble lors de la méiose.

Ainsi, sur la figure, l'allèle M sera transmis avec l'allèle A1.

Si à ce locus de M, il existe différents allèles possibles, ces allèles peuvent servir de marqueurs de A.

Lors de la méiose ont lieu des

"crossing-over" c'est-à-dire des échanges d'ADN entre chromosomes.

Génotype d'un parent (A1A2-B1B2)

Méiose

Pour les deux gènes A et B donnés, les gamètes ont donc quatre génotypes possibles : deux d'origine parentale (A1B1 et A2B2) et deux recombinés (A1B2 et A2B1).

M A1

A2

B1

B2 A1

A2

B1

B2 A2

B1 B2

A1

A2

A1 B1

B2

A1 B1 A2 B2 A1 B2 A2 B1

M

M M

B1 A2 A1

B1

A1 B2 A2

B2

Un marqueur peut être : - un gène ;

- un minisatellite, c'est-à-dire un fragment d'ADN constitué de répétitions de séquences fixes de 10 à 30 nucléotides ;

- un microsatellite, c'est-à-dire un fragment d'ADN constitué de 10 à 20 répétitions du même mono- ou di- ou tri-nucléotides.

Figure 1. Définition et propriétés d’un marqueur.

(6)

populations diffŽrentes. Le dŽsŽquilibre est maximal au cours des premi•res gŽnŽrations de croisement, les associations entre locus chez les gam•tes ressemblant aux formes prŽ- sentes dans les chromosomes des lignŽes parentales. Puis il sÕattŽnue au cours des gŽnŽ- rations, avec lÕaccumulation des recombinai- sons. Deuxi•me possibilitŽ, la population est en Žquilibre de liaison. Dans ce cas, on utilise les dŽsŽquilibres qui existent nŽcessairement dans des sous-populations, en particulier intra famille. Ainsi, par exemple, dans la descen- dance dÕun parent double hŽtŽrozygote pour deux locus liŽs, il y a nŽcessairement dŽsŽqui- libre de liaison, car les gam•tes parentaux sont plus nombreux que les gam•tes recombi- nants. Toutefois, les all•les prŽfŽrentiellement associŽs varient dÕune famille ˆ lÕautre.

d / FacilitŽ de typage

Les protocoles impliquant des marqueurs molŽculaires sont frŽquemment de grande taille et nŽcessitent des milliers, voire des dizaines ou des centaines de milliers de dŽtermination dÕall•les, ou Ç typages È. Les gŽnotypages doivent donc •tre rapides, peu cožteux et automatisables. Sans que ce soit une obligation absolue, lÕunicitŽ de la tech- nique de marquage est en gŽnŽral recherchŽe car elle facilite beaucoup la robotisation et diminue donc les cožts. La mise en place de structures spŽcialisŽes dans le typage ˆ grande Žchelle, comme le GIE Labogena, rŽpond ˆ ce souci dÕefficacitŽ et de ma”trise des cožts.

Par ailleurs, lÕintŽr•t principal dÕun mar- queur rŽside dans la prŽcocitŽ du typage, quand aucune autre information phŽno- typique nÕest encore disponible. La dŽtermi- nation du gŽnotype au marqueur doit •tre possible chez tout animal, sans limite dÕ‰ge, de sexe ou de stade physiologique. Ces consi- dŽrations expliquent lÕintŽr•t des marqueurs ADN, tandis que les marqueurs visibles ou protŽiques requi•rent lÕexpression du g•ne.

Pour des questions de rapiditŽ dÕutilisation et de limitation de la taille des protocoles, on peut souhaiter typer les marqueurs sur des embryons de quelques dizaines de cellules.

Cette technique est actuellement utilisŽe pour sexer des embryons bovins en recherchant des sŽquences spŽcifiques du chromosome Y. Les deux probl•mes essentiels associŽs au typage sur embryon sont dÕune part lÕaltŽration de la qualitŽ de lÕembryon (altŽration de la mem- brane pellucide, prŽl•vement de quelques cel- lules) affectant son aptitude ˆ la congŽlation et sa survie ultŽrieure (voir lÕarticle de Col- leau et al,ce numŽro), mais surtout la quan- titŽ tr•s restreinte dÕADN disponible, avec les probl•mes de sensibilitŽ de la mŽthode de typage et les risques de contamination par de lÕADN exog•ne. A lÕextr•me, quelques Žquipes rŽalisent m•me des typages molŽculaires sur spermatozo•de unique. Cette technique, dont lÕintŽr•t zootechnique est limitŽ, peut sÕavŽrer tr•s utile pour la cartographie fine de locus tr•s liŽs.

2 / DŽveloppements rŽcents en gŽnŽtique molŽculaire

LÕutilisation des marqueurs nÕa pu se dŽve- lopper rapidement au cours des derni•res annŽes que gr‰ce aux progr•s importants de la gŽnŽtique molŽculaire et ˆ la mise ˆ dispo- sition dÕoutils et de techniques, qui ont ouvert la voie ˆ la construction des cartes gŽnŽtiques dans les diffŽrentes esp•ces dÕŽlevage. Parmi les dŽveloppements rŽcents, il convient de citer la mise en Žvidence des microsatellites et la rŽaction dÕamplification par PCR qui ont eu un impact particuli•rement marquŽ sur lÕŽta- blissement des cartes gŽnŽtiques.

2.1 / Microsatellites

JusquÕˆ la fin des annŽes 1970, la principale limite ˆ lÕŽtablissement de cartes gŽnŽtiques Žtait le manque de marqueurs polymorphes et bien rŽpartis. Au cours des annŽes 1980, de nouvelles sources de polymorphisme ont ŽtŽ dŽcouvertes. Tr•s nombreux, les polymor- phismes de longueur de fragment de restric- tion (RFLP), largement utilisŽs en cartogra- phie vŽgŽtale, se sont rŽvŽlŽs assez limitŽs mais surtout difficiles ˆ analyser de fa•on rapide et automatisable. ConstituŽs dÕun nombre tr•s variable de rŽpŽtitions de sŽquences de 10 ˆ 30 bases, les minisatellites permettent lÕidentification dÕempreintes gŽnŽ- tiques tr•s spŽcifiques de chaque individu ; ils sont tr•s polymorphes mais assez mal rŽpar- tis sur le gŽnome et surtout difficilement interprŽtables, les bandes rŽvŽlŽes correspon- dant ˆ lÕobservation simultanŽe dÕun nombre variable et ŽlevŽ de locus.

En 1989, la description de microsatellites a incontestablement permis lÕessor des projets de cartographie. Les microsatellites sont des sŽquences constituŽes de rŽpŽtitions en tan- dem de mono-, di Ð ou trinuclŽotides rŽpŽtŽs de 10 ˆ 20 fois en moyenne. Un motif rŽpŽtŽ frŽquemment rencontrŽ est le dinuclŽotide TG. Tr•s nombreuses, bien rŽparties sur le gŽnome, ces sŽquences se caractŽrisent par un polymorphisme important dž ˆ la variation du nombre de rŽpŽtitions selon les all•les.

LÕutilisation de ce type de marqueur nŽcessite la mise en Ïuvre des deux types de tech- niques suivants :

- comme pour les minisatellites, une telle dŽfinition du microsatellite ne caractŽrise pas un locus particulier, mais toutes les sŽquences de ce type dans lÕensemble du gŽnome. Le locus doit •tre dŽfini de fa•on unique en consi- dŽrant les sŽquences flanquantes, cÕest-ˆ-dire de part et dÕautre, du microsatellite, ce qui implique une phase de sŽquen•age lors de la caractŽrisation du marqueur ;

- la mise en Žvidence du polymorphisme est une difficultŽ majeure, rŽsolue par lÕamplifica- tion PCR (voir plus loin) de la sŽquence entou- rant le microsatellite puis Žlectrophor•se de lÕamplifiat sur gel dÕacrylamide dont la haute rŽsolution permet de distinguer les all•les dont la taille diff•re de deux bases seulement.

(7)

Dans toutes les esp•ces o• ils ont ŽtŽ recherchŽs, les microsatellites ont pu •tre rapidement identifiŽs en grand nombre et leurs propriŽtŽs (polymorphisme, rŽpartition) ont ŽtŽ confirmŽes.

2.2 / Amplification par PCR

La technique dÕamplification par Ç rŽaction en cha”ne par la polymŽrase È (ou PCR), dŽcrite il y a quelques annŽes est maintenant utilisŽe dans de tr•s nombreuses applications de gŽnŽtique molŽculaire. Elle est entre autres indispensable pour mettre en Žvidence le poly- morphisme des microsatellites. Gr‰ce ˆ elle, on peut disposer en quelques heures de millions de copies dÕun fragment dÕADN compris entre deux petites sŽquences connues. Ces deux petites sŽquences, dites amorces, sont fournies comme rŽactif, avec lÕADN gŽnomique total, la polymŽrase, des nuclŽotides et divers facteurs.

Dans lÕapproche classique, les nuclŽotides four- nis pour la rŽaction sont radioactifs, de sorte que les diffŽrents all•les sont distinguŽs par autoradiographie apr•s Žlectrophor•se. Depuis quelques annŽes, la radioactivitŽ est remplacŽe par lÕutilisation dÕamorces fluorescentes.

2.3 / StratŽgie dÕŽtablissement des cartes gŽnŽtiques

LÕŽtablissement des cartes gŽnŽtiques suit la logique suivante :

- constitution dÕune collection dÕADN gŽno- mique de familles de rŽfŽrence, familles dans lesquelles sont analysŽes les liaisons entre marqueurs. Les familles gŽnŽralement choi- sies comprennent les deux parents et 10 ˆ 30 produits, la structure familiale pouvant •tre nuclŽaire ou hiŽrarchique. Un panel com- prend gŽnŽralement de 150 ˆ 300 individus au total, cet effectif Žtant un bon compromis entre le travail de typage ˆ rŽaliser et la prŽ- cision souhaitŽe dans lÕestimation des dis- tances. Pour favoriser la construction dÕune carte unique au niveau international, ce panel est distribuŽ ˆ toutes les Žquipes impliquŽes ;

- recherche de microsatellites par criblage de banque dÕADN gŽnomique avec une sonde oligonuclŽotidique (par exemple (TG)n) puis caractŽrisation par sŽquen•age du motif rŽpŽtŽ et des sŽquences flanquantes ;

- typage des individus du panel de rŽfŽrence pour les marqueurs ŽtudiŽs, centralisation des rŽsultats et analyse de liaison pour ordonner les marqueurs les uns par rapport aux autres et estimer leurs distances gŽnŽtiques.

2.4 / Apports de la carte physique

Des outils de carte physique, sans •tre indispensables, aident considŽrablement la construction dÕune carte gŽnŽtique saturŽe.

Ainsi, les lignŽes cellulaires dÕhybrides soma- tiques, constituŽes de cellules h™tes dÕune esp•ce diffŽrente ayant incorporŽ un ou quelques chromosomes de lÕesp•ce ŽtudiŽe, sont un outil simple et rapide de construction des groupes de syntŽnie. Un groupe de syntŽ-

nie est constituŽ des marqueurs situŽ sur un chromosome ou un fragment chromosomique donnŽ et quÕon trouve donc chez les m•mes hybrides cellulaires. DÕautre part, la tech- nique dÕhybridation in situ, employant histori- quement la radioactivitŽ et maintenant des sondes fluorescentes (FISH), permet de locali- ser prŽcisŽment une sŽquence sur un chromo- some. Elle permet donc dÕaffecter un groupe de liaison ˆ un chromosome, de lÕorienter sur le chromosome, et de vŽrifier que la carte gŽnŽtique couvre tout le gŽnome.

2.5 / Situation actuelle

Les cartes gŽnŽtiques sont maintenant tr•s denses chez lÕhomme et la souris, avec plu- sieurs milliers de marqueurs microsatellites et de g•nes localisŽs, et elles continuent ˆ pro- gresser tr•s rapidement. Parmi les esp•ces dÕŽlevage, les cartes bovine et porcine sont les plus avancŽes (Barendsee et al 1997). Fin 1997, la carte bovine comptait 1 200 mar- queurs microsatellites et plus de 200 g•nes localisŽs. Tous les groupes de liaison sont assi- gnŽs ˆ un chromosome et orientŽs. Un effort important est aussi portŽ sur le dŽveloppe- ment des cartes du poulet et des ovins. LÕINRA a rŽalisŽ la premi•re carte caprine.

Un important travail est en cours pour faci- liter lÕutilisation en routine des marqueurs.

Cette Žtape consiste ˆ choisir un sous- ensemble de 150 ˆ 250 marqueurs bien rŽpar- tis sur tout le gŽnome, suffisamment poly- morphes, et surtout bien adaptŽs aux procŽdures de typage automatisŽes par sŽquenceur automatique. La mise au point de ce sous-ensemble est une Žtape prŽalable indispensable ˆ lÕutilisation ˆ tr•s grande Žchelle des marqueurs molŽculaires.

3 / Un exemple dÕutilisation des marqueurs : lÕanalyse du dŽterminisme gŽnŽtique dÕun caract•re complexe

La recherche des g•nes rŽgissant un carac- t•re peut se faire selon des mŽthodes tr•s dif- fŽrentes. LÕapproche la plus intuitive, qui sÕap- puie sur lÕanalyse physiologique des fonctions impliquŽes, consiste ˆ remonter la cha”ne qui va du caract•re ˆ la protŽine et au g•ne. Elle consiste donc ˆ vŽrifier lÕeffet possible dÕun g•ne Ç candidat È a priori impliquŽ dans le dŽterminisme du caract•re. Cette approche a connu quelques succ•s, comme par exemple lÕidentification de lÕeffet du g•ne de la casŽine αs1 sur la composition du lait de ch•vre ou la comprŽhension du mode dÕaction du g•ne de nanisme chez la poule. Ces quelques succ•s ne doivent pas cacher les difficultŽs de cette mŽthode pour les caract•res complexes, diffi- cultŽs liŽes avant tout au nombre tr•s ŽlevŽ de g•nes candidats possibles et au fait que la plupart dÕentre eux ne sont pas connus. Dans un premier temps, la recherche ˆ lÕaide de marqueurs des rŽgions chromosomiques Les progr•s

importants rŽalisŽs en biologie molŽculaire ont permis dÕŽtablir les cartes gŽnŽtiques des diffŽrentes esp•ces dÕintŽr•t zootechnique.

(8)

impliquŽes (ou QTL, pour Ç quantitative trait locus È) est souvent prŽfŽrable. Bien quÕelle ne permette pas de dŽterminer la nature du g•ne responsable ni son mode dÕaction, elle prŽ- sente divers avantages dŽcisifs : elle facilite considŽrablement la recherche ultŽrieure dÕun g•ne candidat, en comparant sa position sur la carte gŽnŽtique avec celle du QTL dŽtectŽ ; m•me si le g•ne impliquŽ reste inconnu, sa localisation par marqueurs permet son utili- sation, par exemple en sŽlection.

3.1 / Principe

Le principe dŽcoule directement des pro- priŽtŽs des marqueurs. ConsidŽrons un repro- ducteur double hŽtŽrozygote MQ/mq pour deux locus liŽs, le taux de recombinaison entre ces deux locus Žtant r. Le premier locus nÕest pas observable directement mais il agit sur le caract•re dÕintŽr•t, de sorte que la sub- stitution de lÕall•le q par lÕall•le Q chez un descendant entra”ne un effet notŽ a. Le deuxi•me locus nÕa pas dÕeffet sur le caract•re mais ses deux all•les M et m peuvent •tre observŽs et distinguŽs lÕun de lÕautre. Les gam•tes produits par ce reproducteur sont de quatre types, deux types parentaux MQ et mq, de frŽquence (1-r)/2 et chez lesquels lÕha- plotype marqueur-QTL est le m•me que chez le parent, et deux types dits recombinants, Mq et mQ, de frŽquence r/2, et issus dÕune recombinaison chez le parent.

Si les locus sont liŽs, le taux de recombinai- son r est infŽrieur ˆ 0,5, les gam•tes paren- taux sont plus frŽquents que les gam•tes recombinants, et la diffŽrence de performance entre les produits de ce reproducteur ayant re•us M et m est de a(1-2r). Plus le marqueur est proche du QTL, plus lÕeffet apparent du marqueur est ŽlevŽ et proche de lÕeffet vrai du QTL. Au contraire, lÕefficacitŽ du marqueur diminue lorsquÕil sÕŽloigne du QTL, pour deve- nir nulle lorsque le marqueur et le QTL ne sont pas liŽs.

Pour quÕun QTL, dont la position est quel- conque et inconnue, puisse •tre dŽtectŽ, il est nŽcessaire de disposer de marqueurs nom- breux et couvrant tout le gŽnome. La taille des gŽnomes animaux Žtant proche de 30 Morgans (soit 3 000 cM), un rŽseau de 150 marqueurs informatifs uniformŽment rŽpartis tous les 20 cM permet en thŽorie de couvrir tout le gŽnome et de dŽtecter tous les QTL dÕintŽr•t. Ceci explique la nŽcessitŽ de constituer une carte gŽnŽtique prŽcise, avant de rechercher des QTL.

LÕutilisation dÕune carte prŽcise prŽsente un autre avantage. Lorsque les marqueurs sont analysŽs un par un, il est possible de dŽtecter un QTL, mais pas de le localiser prŽcisŽment par rapport au marqueur liŽ, ni dÕen estimer son effet. En effet, avec un seul marqueur, il est difficile de distinguer un QTL proche ˆ petit effet dÕun QTL ˆ gros effet mais plus ŽloignŽ, les deux situations confŽrant au mar- queur le m•me effet apparent. LÕanalyse simultanŽe de marqueurs adjacents (Ç inter- val mapping È) permet dÕaugmenter un peu la

puissance de dŽtection mais surtout dÕestimer ˆ la fois lÕeffet et la position du QTL (Lander et Botstein 1989). Diverses mŽthodes statis- tiques peuvent •tre utilisŽes mais le principe gŽnŽral est le suivant. En une position x sup- posŽe du QTL, on calcule, ˆ partir de lÕinfor- mation marqueur des parents et des produits, la probabilitŽ p(x) que le segment chromoso- mique re•u du parent par le produit pro- vienne de son grand-p•re ou de sa grand- m•re. LÕeffet du QTL supposŽ en x peut ensuite •tre estimŽ par le coefficient de rŽgression linŽaire de la performance sur cette probabilitŽ. La prŽsence dÕun QTL est testŽe par le rapport des vraisemblances sous les hypoth•ses de prŽsence ou dÕabsence du QTL. Si lÕhypoth•se dÕabsence de QTL est rejetŽe, sa position la plus probable est celle qui maximise le rapport de vraisemblance.

3.2 / Types de protocole (figure 2)

Tous les protocoles reposent sur lÕutilisation de reproducteurs doubles hŽtŽrozygotes aux marqueurs et au QTL. Dans les protocoles de dŽtection de QTL les plus simples, comme ceux utilisŽs chez les plantes, le reproducteur est un individu F1 issu du croisement entre deux lignŽes consanguines, donc totalement homo- zygotes (Paterson et al1988). La population F1 est totalement homog•ne et se comporte comme un individu unique. Le dŽsŽquilibre de liaison existant en deuxi•me gŽnŽration, F2 ou back-cross, est mis ˆ profit pour Žtablir les associations entre marqueurs et QTL. La puis- sance dÕun tel dispositif est maximale, ne dŽpendant que de lÕeffectif mesurŽ, de la part de variance expliquŽe par le QTL et de la dis- tance entre marqueurs et QTL.

En lÕabsence de lignŽes consanguines, tr•s difficiles ˆ obtenir chez les animaux dÕŽlevage, le m•me principe peut •tre appliquŽ en croi- sant des races diffŽrentes, ou des lignŽes diffŽ- rentes, voire des lignŽes sŽlectionnŽes de fa•on divergente. Cependant, dans un tel dispositif, les populations parentales ne sont pas totale- ment homog•nes. Les all•les nÕŽtant pas fixŽs dans ces populations parentales, il subsiste un polymorphisme au QTL, aux marqueurs, ainsi que dans le reste du gŽnome et donc dans la composante polygŽnique affectant le caract•re.

La F1 est donc constituŽe dÕun mŽlange dÕindi- vidus doubles hŽtŽrozygotes au marqueur et au QTL, hŽtŽrozygotes au marqueur mais homozygotes au QTL, homozygotes au mar- queur et hŽtŽrozygotes au QTL, ou doubles homozygotes. LÕinformativitŽ des marqueurs varie dÕun reproducteur F1 ˆ lÕautre. Enfin, la composante polygŽnique varie aussi dÕun indi- vidu F1 ˆ lÕautre. Cette hŽtŽrogŽnŽitŽ intro- duit un bruit de fond qui contribue dÕune part ˆ diminuer la puissance de dŽtection du dispo- sitif, dÕautre part ˆ rendre beaucoup plus com- plexes lÕŽlaboration du protocole et lÕanalyse des rŽsultats. Ce bruit de fond est dÕautant plus ŽlevŽ que les populations parentales sont hŽtŽrog•nes et proches lÕune de lÕautre. Le dŽsŽquilibre de liaison, dont on cherche ˆ maximiser le niveau par croisement, nÕest pas total. La structure familiale de la deuxi•me

LÕexpression dÕun caract•re quantitatif est gouvernŽe par des g•nes appelŽs QTL pour Quantitative Trait Loci.

(9)

gŽnŽration, quelconque dans le cas du croise- ment entre lignŽes consanguines, doit •tre optimisŽe dans le cas du croisement entre races. En effet, un compromis doit •tre trouvŽ entre le nombre de familles, suffisamment ŽlevŽ pour limiter le risque que le dispositif soit peu informatif, et la taille des familles, suffisamment importante pour que lÕon dis- tingue lÕeffet du QTL de lÕeffet famille. LÕinfor- mativitŽ variable des marqueurs dÕune famille ˆ lÕautre nŽcessite lÕanalyse simultanŽe de tous les marqueurs dÕun m•me groupe de liaison, de sorte que la position testŽe pour le QTL soit le plus souvent possible encadrŽe par deux marqueurs informatifs.

Les QTL peuvent aussi •tre recherchŽs intra population. Dans ce cas, lÕhypoth•se de base est lÕŽquilibre de liaison entre marqueurs et QTL dans lÕensemble de la population. Le dispositif tire donc profit du dŽsŽquilibre de liaison, qui existe nŽcessairement intra famille. LÕeffet apparent du marqueur nÕest dŽfini quÕintra famille et il est susceptible de varier dÕune famille ˆ lÕautre. Les rŽsultats sont combinŽs entre familles en dŽterminant la part de variance expliquŽe par une rŽgion chromosomique donnŽe. Ce type de protocole, souvent bien adaptŽ aux contraintes des populations animales, est cependant moins puissant que les protocoles en croisement.

DÕune part, le nombre de parents homozy- gotes au QTL, alourdissant inutilement le protocole, est plus ŽlevŽ quÕen croisement, et il est gŽnŽralement incontr™lable. De m•me, le nombre de marqueurs ˆ considŽrer est plus ŽlevŽ, du fait quÕun marqueur nÕest pas ˆ lÕŽtat hŽtŽrozygote chez tous les reproduc-

teurs, et ne permet donc pas de rechercher des QTL dans ces familles. DÕautre part, un protocole intra population demande des familles plus grandes quÕun protocole de croi- sement. Comme il est souvent difficile dÕobte- nir de grandes familles de pleins-fr•res sÏurs, un seul parent, le p•re, est compl•te- ment informatif, et les diffŽrences recherchŽes entre gŽnotypes sont alors deux fois plus faibles que dans un protocole de croisement.

Deux protocoles intra population sont clas- siquement proposŽs et reposent sur lÕanalyse de 2 ou 3 gŽnŽrations successives. Le proto- cole sur deux gŽnŽrations (Soller et Genizi 1978) consiste ˆ analyser des familles de pro- duits issus de p•res hŽtŽrozygotes aux mar- queurs et ˆ un QTL supposŽ, et ˆ comparer intra-p•re les moyennes de production des deux groupes de descendants ayant re•u lÕun ou lÕautre all•le marqueur paternel. LÕincon- vŽnient de ce dispositif est le nombre tr•s ŽlevŽ, en gŽnŽral plusieurs milliers, dÕindivi- dus ˆ Žlever, gŽnotyper et dont il faut mesurer les performances, pour assurer une bonne puissance de dŽtection.

Pour amŽliorer cette puissance de dŽtection ˆ nombre de typages fixŽ, le protocole peut

•tre Žtendu sur trois gŽnŽrations (Weller et al 1990). Le p•re, supposŽ double hŽtŽrozygote aux marqueurs et au QTL, a des fils dont la valeur gŽnŽtique est estimŽe sur descendance ˆ partir des performances de leurs produits.

Le QTL supposŽ est dŽtectŽ par la recherche dÕune association entre la valeur gŽnŽtique estimŽe des fils et lÕall•le marqueur quÕils ont re•u de leur p•re. Dans ce protocole, le carac- t•re est mesurŽ sur les descendants de troi- La recherche

de QTL peut se faire ˆ lÕaide de marqueurs en utilisant leurs propriŽtŽs :

polymorphisme et liaison avec le QTL supposŽ.

Figure 2. Dispositifs de recherche de QTL à l’aide de marqueurs.

On attend une distribution des perfor- mances selon l'allèle marqueur reçu

Croisement entre populations (races ou lignées) différant par le marqueur et par la performance

Si le marqueur M est proche du QTL recherché, marqueur et QTL seront transmis ensemble

puis croisement entre deux reproducteurs F1

Performance élevée Performance faible

Performance intermédiaire Performance

élevée

Performance faible M1 Q

M1 Q

M2 q M2 q

Première génération F1 M1 Q M2 q

M1 Q

M1 Q M1 Q

M2 q

M2 q M2 q

X

M1 Q M2 q

M1 Q M2 q

X

Dans une population, on recherche le QTL à l'aide de marqueurs intra-famille M1 Q

M2 q

Z Z Z Z

X

M1 Q Z Z

M2 q Z Z On analyse les performances des deux

groupes en fonction de l'allèle marqueur reçu

(10)

si•me gŽnŽration, mais seuls le p•re et ses fils sont gŽnotypŽs aux marqueurs. LÕintŽr•t de ce protocole est de rŽduire la variabilitŽ rŽsi- duelle du caract•re, qui sÕapparente ˆ une moyenne de performances. En consŽquence, la puissance de dŽtection est nettement amŽlio- rŽe. En pratique, le nombre de performances ˆ mesurer est tr•s ŽlevŽ, de sorte que ce proto- cole nÕest rŽellement envisageable que si les donnŽes existent dŽjˆ avec une structure de population adaptŽe, ce qui est le cas chez les bovins laitiers (Georges et al 1995). Dans cette esp•ce, le testage sur descendance est une gŽnŽralitŽ et, au moins dans les plus grandes races, il concerne frŽquemment des familles de plusieurs dizaines de taureaux demi-fr•res de p•res. Le cožt marginal dÕun tel programme est alors rŽduit au dŽveloppe- ment des marqueurs et au typage des tau- reaux dÕinsŽmination artificielle, dont lÕADN est par ailleurs facilement disponible.

3.3 / MŽthodes alternatives

LÕanalyse de liaison classique demande des effectifs importants, entra”nant ˆ la fois un cožt de typage ŽlevŽ et un protocole lourd, en particulier lorsque le caract•re observŽ nuit ˆ la santŽ ou ˆ la bonne reproduction des ani- maux. Lorsque le caract•re est soumis ˆ un dŽterminisme monogŽnique et que le phŽno- type permet de dŽduire le gŽnotype sans Žquivoque, une mŽthode alternative dite Ç homozygozity mapping È a ŽtŽ proposŽe, parti- culi•rement bien adaptŽe aux maladies rŽces- sives. Son principe est le suivant. ConsidŽrons un ensemble dÕindividus consanguins, dont lÕanc•tre commun au p•re et ˆ la m•re est hŽtŽrozygote pour le g•ne recherchŽ. Si lÕano- malie est rare, les descendants prŽsentant lÕanomalie, et donc homozygotes, ont re•u vrai- semblablement deux copies du m•me g•ne portŽ par lÕanc•tre commun. Chez ces descen- dants, les marqueurs proches du g•ne recher- chŽ sont donc Žgalement ˆ lÕŽtat homozygote, sous lÕhypoth•se dÕabsence de recombinaison.

Si un marqueur non liŽ au g•ne recherchŽ est tr•s polymorphe, la probabilitŽ quÕil soit par hasard ˆ lÕŽtat homozygote chez les individus affectŽs dŽcro”t tr•s vite quand le nombre dÕin- dividus considŽrŽs et le nombre de maillons dans la cha”ne de parentŽ entre les individus et leur anc•tre augmentent. LÕefficacitŽ de la mŽthode est augmentŽe en considŽrant des haplotypes, cÕest-ˆ-dire des ensembles de mar- queurs adjacents. En pratique, ˆ condition quÕune carte gŽnŽtique prŽcise et assez dense soit disponible, quelques individus affectŽs suffisent pour localiser le g•ne recherchŽ.

Cette mŽthode a ensuite ŽtŽ Žtendue ˆ des situations o• les hypoth•ses sont moins res- trictives. On recherche chez des individus dÕun phŽnotype donnŽ une concentration plus forte quÕespŽrŽe dÕun haplotype marqueur Ç iden- tique par descendance È, cÕest-ˆ-dire dŽrivant par transmission mendŽlienne dÕun haplotype anc•tre unique (Houwen et al1994). LÕŽloigne- ment de lÕanc•tre est un param•tre important, qui dŽfinit la taille du dispositif. Si lÕanc•tre est proche, des concentrations fortuites dÕha-

plotypes sont possibles, demandant alors des effectifs dÕindividus affectŽs un peu plus Žle- vŽs. Cependant, le nombre total dÕindividus produits et mesurŽs reste limitŽ. Par contre, les recombinaisons Žtant peu nombreuses, le g•ne recherchŽ ne peut pas •tre localisŽ prŽci- sŽment. Au contraire, si lÕanc•tre commun est ŽloignŽ, le nombre dÕindividus affectŽs est faible, ce qui nŽcessite un dispositif de grande taille quant ˆ lÕeffectif produit et mesurŽ. Mais la probabilitŽ de concentration fortuite deve- nant nŽgligeable, le nombre dÕindividus affec- tŽs nŽcessaire pour conclure est tr•s rŽduit. La probabilitŽ de recombinaison entre marqueurs et g•ne recherchŽ Žtant plus ŽlevŽe, brisant ainsi lÕassociation dŽfinissant lÕhaplotype, le segment conservŽ au cours des gŽnŽrations est plus court et demande donc, pour •tre mis en Žvidence, une carte de marqueurs plus dense.

Mais, le nombre de recombinaisons accumu- lŽes Žtant plus important, la localisation du g•ne est plus fine. Ces techniques, dites dÕidentitŽ par descendance (Identity by des- cend=IBD), sont encore tr•s rŽcentes et demandent encore des dŽveloppements, mais elles sont tr•s prometteuses.

4 / Revue des diffŽrentes utilisations possibles des marqueurs gŽnŽtiques

Les propriŽtŽs des marqueurs, polymor- phisme et liaison, peuvent •tre mises ˆ profit pour la gestion gŽnŽtique des populations. Le polymorphisme est utile pour Žtablir lÕori- gine gŽnŽtique du locus concernŽ : au niveau individuel, puisque pour un individu hŽtŽro- zygote en un locus il est en gŽnŽral possible de conna”tre lÕorigine grand-parentale du seg- ment gŽnomique quÕil transmet ˆ ses descen- dants ; au niveau des populations, sous lÕhy- poth•se que les formes possibles pour un m•me segment gŽnomique diff•rent dÕautant plus que les populations sont phylogŽnŽtique- ment plus ŽloignŽes. La liaison gŽnŽtique est utile pour gŽnŽraliser les conclusions des observations sur un locus particulier ˆ lÕen- semble de lÕADN proche de ce locus : si, lors de la mŽiose, il nÕy a de recombinaison entre le segment gŽnomique visualisŽ et les zones avoisinantes, ce segment gŽnomique devient un marqueur gŽnŽtique de ces zones et notamment des g•nes quÕelles contiennent.

Dans certaines applications, les marqueurs sont utilisŽs pour suivre lÕensemble du gŽnome, dans dÕautres applications, ils nous renseignent sur la transmission de g•nes qui leur sont liŽs.

4.1 / Marquage de lÕensemble du gŽnome

LÕidŽe de base est que lÕensemble du gŽnome peut •tre approchŽ par lÕinformation apportŽe par un ensemble de marqueurs bien rŽpartis.

Ceci peut •tre mis ˆ profit pour lÕidentification dÕindividus ou de groupes, la gestion de la

(11)

diversitŽ gŽnŽtique entre ou intra populations ou lÕorganisation dÕun plan dÕintrogression (cÕest-ˆ-dire lÕintroduction par croisements dÕun g•ne prŽcis dans une population).

Lecontr™le de filiationest une des appli- cations les plus anciennes du marquage gŽnŽ- tique. Son principe est la recherche dÕincohŽ- rences entre les gŽnotypes en diffŽrents locus marqueurs dÕun individu et de ses parents.

Par exemple, un descendant de gŽnotype M1M1 au locus Met de m•re certaine M1M1 ne saurait avoir un individu de gŽnotype M2M2 pour p•re. Le contr™le de filiation pro- c•de donc par exclusion, celle-ci Žtant dÕautant plus probable que le nombre de locus analysŽs est important et quÕils sont plus polymorphes.

En France, le contr™le de filiation est une obligation lŽgale (taureaux dÕinsŽmination, embryons) ˆ la charge dÕune structure unique (Labogena) qui, en 1994, a vŽrifiŽ la filiation de 17 000 bovins, 2 000 ovins, 500 caprins et 25 000 Žquins. Les outils utilisŽs sont pour lÕessentiel des antig•nes des globules rouges.

Parall•lement ˆ ces techniques immunolo- giques, des techniques biochimiques permet- tent de dŽtecter le polymorphisme de pro- tŽines sanguines par Žlectrophor•se. Ainsi, pour les bovins, 11 marqueurs sont ŽtudiŽs qui contiennent de 2 ˆ 800 all•les chacun, confŽrant une efficacitŽ thŽorique (ou probabi- litŽ a priori dÕexclusion) variant selon les races, de lÕordre de 0,99 pour la race Charo- laise ˆ 0,96 pour la race Holstein. Des efforts portent aujourdÕhui sur lÕutilisation de mar- queurs microsatellites pour rŽaliser ces contr™les. Ces marqueurs ont lÕavantage de leur efficacitŽ due ˆ leur fort polymorphisme, de leur abondance et de leur simplicitŽ dÕem- ploi, puisquÕil nÕest plus nŽcessaire de pro- duire de rŽactifs immunologiques.

Pour des situations extr•mes dans les- quelles les accouplements ne peuvent pas •tre contr™lŽs, cÕest lÕidentification plut™t que le contr™le des paternitŽs qui est recherchŽe, cette identification se faisant a posteriori, ˆ lÕaide de marqueurs gŽnŽtiques. Ce cas est frŽquent chez les arbres, les poissons ou les animaux sauvages pour lesquels lÕutilisation des marqueurs tr•s polymorphes appara”t comme une solution efficace. Son extension aux mammif•res dÕŽlevage pourrait parfois

•tre envisagŽe.

LÕidentification des lignŽesen vue dÕune protection des droits de leur crŽateur est une prŽoccupation importante des sŽlectionneurs de plantes. Ici encore, les marqueurs de lÕADN sont des candidats de choix pour Žtablir un profil gŽnŽtique spŽcifique de chaque lignŽe.

Si lÕon se rŽf•re aux rŽflexions relatives ˆ la brevetabilitŽ du vivant, ce type dÕapplication pourrait se dŽvelopper dans le futur pour les animaux domestiques.

Les gŽnŽticiens essaient depuis longtemps de situer gŽnŽtiquement les diffŽrentes sous- populations dÕune m•me esp•ce (races, lignŽes, rameaux) les unes par rapport aux autres. Au-delˆ de son intŽr•t historique, la connaissance des filiations entre ces sous- populations est nŽcessaire ˆ lÕorganisation des

programmes de conservation de la diver- sitŽ gŽnŽtique. Ces programmes ont pour ambition dÕŽviter la perte de g•nes qui pour- raient se rŽvŽler utiles dans lÕavenir si les conditions Žconomiques changent ou apr•s un Žpuisement de la variabilitŽ gŽnŽtique immŽ- diatement disponible. Dans le choix des sous- populations conservŽes, les redondances doi- vent •tre ŽvitŽes afin dÕoptimiser lÕutilisation de ressources financi•res limitŽes.

La distance gŽnŽtique entre deux popula- tions peut •tre basŽe sur les informations apportŽes par les frŽquences allŽliques en dif- fŽrents locus. Deux populations sont considŽ- rŽes comme dÕautant plus proches que les dif- fŽrences de frŽquence dÕall•les en diffŽrents locus sont faibles, traduisant ainsi lÕhypoth•se opposŽe qui veut que, par dŽrive, sŽlection et/ou mutation, des populations ŽloignŽes pos- s•dent des distributions dÕall•les tr•s diffŽ- rentes. LÕhypoth•se est aussi faite que les marqueurs observŽs donnent une bonne image de lÕensemble du gŽnome, ce qui sup- pose quÕils soient en nombre suffisant et bien rŽpartis. LÕutilisation des distances entre populations pose toutefois des probl•mes thŽoriques encore en discussion. La notion de distance ne prend rŽellement son sens que dans le cas dÕune structure arborescente dans laquelle existent de rŽelles filiations entre les races. Or, pour les animaux dÕŽlevage, il est vraisemblable que les croisements opŽrŽs depuis la domestication se traduisent par une structure des relations entre races en rŽseau plut™t quÕen arbre. Par ailleurs, dans la pers- pective de recherche de redondances pour les aptitudes dÕŽlevage, il faut sÕinterroger sur lÕintŽr•t de lÕutilisation de marqueurs neutres (nÕagissant pas sur les caract•res sŽlection- nŽs) tels que les microsatellites.

Enfin, ˆ lÕimage des essais rŽalisŽs dans le domaine vŽgŽtal, les distances gŽnŽtiques pourraient •tre un ŽlŽment de dŽcision dans le choix de lignŽes devant •tre croisŽes pour exploiter les effets dÕhŽtŽrosis(supŽrioritŽ de lÕindividu croisŽ par rapport ˆ la moyenne de ses parents). En effet, lÕhŽtŽrosis est sou- vent expliquŽ par lÕhypoth•se dÕune domi- nance orientŽe dans laquelle une majoritŽ de g•nes contr™lant un m•me caract•re sont sou- mis ˆ un effet de dominance (pour un g•ne G, on parle de dominance si les individus G1G2 ont une valeur supŽrieure ˆ la moyenne des homozygotes G1G1 et G2G2). Sous cette hypo- th•se, lÕhŽtŽrosis est donc dÕautant plus fort que les lignŽes soumises au croisement sont gŽnŽtiquement diffŽrentes (et homozygotes), donc que les produits croisŽs sont hŽtŽrozy- gotes en un plus grand nombre de g•nes.

Les marqueurs peuvent •tre aussi utilisŽs pour maintenir la variabilitŽ gŽnŽtique des petites populations en conservation. Le principe est de sŽlectionner les reproducteurs sur leur taux dÕhŽtŽrozygotie estimŽ par la proportion de locus hŽtŽrozygotes parmi un nombre donnŽ de locus marqueurs.

LÕefficacitŽ relative de cette technique est dÕautant meilleure que la population est de faible effectif.

La localisation de marqueurs sur lÕensemble du gŽnome permet de conna”tre plus prŽcisŽment les diffŽrentes populations dÕune esp•ce, contribuant ainsi ˆ amŽliorer leur gestion.

Références

Documents relatifs

L’objectif de cette étude a été d’estimé la diversité génétique de la population porcine Créole de Guadeloupe en utilisant un panel de marqueurs microsatellites.. Photo

Pour l’analyse isoenzymatique, 30 plantes ont été étudiées pour 10 gènes, soit 600 informations alléliques recueillies pour chaque population. Dans

à partir de cette lignée d’addition que les recroisements avec la lignée récurrente IR 31917 ont permis d’aboutir à des lignées isogéniques diploïdes et

populations d’effectif petit (moins de 100 reproducteurs efficaces) il semble qu’un marquage peu dense mais uniformément réparti (3 marqueurs pour 100 centimorgans)

❙ Le contrôle de séquence assure, en liaison avec le contrôle d’erreur et le contrôle de flux, la délivrance des trames au récepteur dans l’ordre.. exact de la soumission

35 Signe du fort intérêt porté à cette nouvelle approche de l’amélioration génétique chez les animaux comme chez les végétaux, la sélection génomique est l’un des

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des

L’idée est d’utiliser directement l’information à des marqueurs pour retenir des reproducteurs per- mettant d’espérer une variabilité génétique maxima- le à la