n EgYPtiens Æa
2.4. Variabilité d'autres marqueurs Y-spécifiques dans les populations humaines Les premières études sur la variabilité de I'ADN mitochondrial humain ont suscité un
intérêt de pair pour
la
variation génétique de la partie non recombinante du chromosomeY.
La transmission de ces deux segments haploïdes du génome devrait en effet permettreune reconstruction simple de la
généalogie desvariations.
Cesphylogénies pourrait
éventuellement, à leur tour, être mises en relation avec la différenciation des populations humaines. Pourle
moment, et malgré quelques tentatives (Hazout& Lucotte
1986), une telle reconstruction n'est pas envisageable pour le système p49a,flTaql, car la nature des mutations associées aux variants est trop méconnue.D'autres systèmes polymorphes spécifiques
du
chromosomeY
sont recherchés depuis maintenant bientôt 20 ans, et d'une manière généraleil
apparaît que ce chromosome est moins variable quele
chromosomeX ou
les autosomes. Des études de séquençage de grande envergure, dupoint
de vue du nombre de nucléotides examinés,ont ainsi
révélé un trèsfaible
niveau devariation,
et certains chercheursont
avancé I'hypothèse que lechromosome Y avait expérimenté un ou plusieurs
épisodesde "balayage sélectif"
(selective sweep), à travers lesquels se serait produite la
fixation
de certains variants dans la population(Dorit
eral.
1995;V/hirfield
etal.
1995).Toutefois le faible niveau de polymorphisme caractéristique du
NRY
pourrait s'expliquer, peut-être pas uniquement, mais en tous cas en grande partie, par unetaille
efficace dansla population
quatrefois moins
grande quecelle
des autosomes(Hammer & Zegura
1996).Une
estimation actuelle dela
densité des sites nucléotidiques ségrégants sur leNRY livre
une proportion de 1 site polymorphe pour-3'500
paires de bases(Underhill
etal.1997).
Néanmoins, contrairement aux pronostics des premières recherches intensives
de marqueurs RFLP sur leNRY
(Ngo& Lucotte
1986; Jakubiczka etal.
1989; Malspina etal.
1990; Spurdle& Jenkins I992a),
de nombreuxpolymorphismes
nouveauxont
été récemment identifiés, et continuent del'être. Ceci,
gràce à des technologies plus récentes et plus performantes de labiologie
moléculaire, peut-être moins sensibles à la densité de séquences répétées qui caractérisent le chromosomeY.
On dispose maintenant de plusieurs ensembles de marqueurs spécifiques du chromosome
Y
examinés dans diverses populations. Par exemple, une vingtaine de microsatellites duNRY
sont connus, dont plus d'une dizaine sont testés de manière routinière en médecine légale (Kayseret
al. 1997), et ont permis I'assemblage d'une grande base de données (deKnijff et
al. 1997a, 1997b).Le
microsatellite le plus étudié dans les échantillons humains est lepoly-GATA
du locusDYS19. Celui-ci
est examinésoit
isolément, soit en relation avec d'autres microsatellites ou d'autres marqueurs polymorphes moins variablesr.I e.g. Roewer et al. 1992,1996; Muller et at. 1994; Ciminelli et al. 1995; Falcone er al. 1995; Hammer & Horai 1995; Pena et al. 1995;
Cooper et al. 1996; Deka et al. 1996; Jobling et al. 1996; Ruiz Linares et al. 1996; Sajantila et al. 1996; Salem et al. 1996; Sanrachiara Benerecetti & Semino 1996; Santos et al. 1996; Underhill et al. 1996; Zago et al.1996; Bravi et al . 1997;de Knijff et al. 199'l a, L997b:
Hammer et al.1997; Karafet et al.1997; Kayser et al.1997'Pérez-I*zaun et al. 199?b; Scorecki et al. 1997; Scozzari et al. 199?b;
Zerjal etal.1997; Bianchi et al. 1998; Kitrles er al. 1998; Quintana-Murci et al. in press.
L'analyse
de la variation
des locusmicrosatellites
est complexe: I'homoplasie est une propriété inhérente àleur
mode demutation
(e.g. Valdeset al.
1993;Di
Rienzoet
al.1994; Shriver et
al.
1995; Freimer& Slatkin
1996),les taux de mutation de ces systèmes sont très élevés et pas forcément identiquespour
tous les locus (Weber& Wong
1993;Cooper
et al.
1996;;
Chakrabortyet al.
1997;Heyer et al.
1997;Kayser et al.
1997;Bianchi
etal.
1998;Brinkmann et al.
1998).On
a aussimis
en évidence I'existence de mécanismes de contrainte sur le nombre de répétitions portées par un locus microsatellite (Bowcock et al. 1994; Garza etal.
1995).Outre les microsatellites,
un
des polymorphismes spécifiques duNRY
les plus testés est le marqueurYAP
(Y AIu Polymorphic element)identifié
d'abord par RFLP (Persichetti etal. 1992) puis par PCR (Hammer 1994). Il s'agit d'un membre de la famille
des séquencesAIu, qui
estsoit
présent(YAP+) soit
absent(YAP-)
au locusDYS287
dansI'intervalle 50,
sur le braslong
du chromosome. Les fréquences observées de I'insertionAIu
dans différents échantillons de populations humaines sont rapportées dans la Figure 2.8.Nous avons collaboré à I'analyse de
trois
systèmes polymorphes testés parL.
Quintana-Murci et O.
Semino,du laboratoire de S.
Santachiara Benerecetti, dans une trentained'échantillons de populations. Il s'agit du YAP et de deux microsatellites, DYSl9
etYCAII.
Commepour le
polymorphismep49a,flTaqI,
I'analyse de ces données, décrite dans le détail dans Quintana-Murci etal. (in
press), suggère une relation étroite entre lesaffinités
génétiques des populations,leur
apparentementlinguistique
etleur
localisation géographique (Figure 2.9).Pour les systèmes
YAP, DYS19
etYCAII
nous ne disposions pas des haplotypes; nous avonsdonc adopté I'approche de traitement multi-locus décrite
dansMichalakis &
Excoffier
(1996) pour inférer des distances génétiques entre paires de populations basées sur lestrois
marqueurs.Le coefficient
de corrélation linéaire entre ces distances et cellesinférées
d'aprèsle marquew p4ga,flTaqI est de 0.83 (test de Mantel avec
10'000 permutations,P < 0.001,
comparaison possiblepour
19échantillons
de populations).L'étude de Quintana-Murci et al. (in press) nous apporte donc une
confirmation
indirecte dela
relation étroite, mise en évidence avecle
marqueurp49a,ilTaql
dela
région DAZ, entre différenciations génétique,linguistique
et géographique des populations, pour leur génome strictement paternel.25 50 75 Fréquence de l'insenion Alu (%) :
Afrique Méridionalel @]
r--r ----]
E----Ambo(38), Xhosa (22) Himba (35), V€nd! (2?)
Zoulou (47), Swei (30), Pedi (52)
Îrw.n. (40), Dda (37)
rlE---E---]
Tsonsâ (30), Soùo (45), Hqqo (46) Nâm (23), Sek€le Sôn (45) l4nbâ (4?)
Trunlre Sin (38)
Afrique de I'Oust Wolofr(3lP
MÂndenkr (64)3
--1
n---'t
G.mbi6r(4E).
Nie&tûs (23f
AfriquedEtEst I.-l c.ndes(29).
---T
Edrioplai(64P
Afrique du Nord
---]
r--..1 r---1
Mûqins (,|4)6 Algé.itu (33)l Egyptias (93).
r---..]
I---1
Tunisiqs (58)3 VrUér du Nil (l 53f
Proche Orient Libânô|5 (47), S4hûrd6 (43)l Iraquiens (45)!, Saoudiens (22).
Europe Méridionale G's(84I
Crl.brds (69), Albù.ir (49)l Sicitiens(52)3
Barqm (25)e, Sùd6 (90), Espr8nols du Sud (4t)6
r---l
Europe du Nord et de I'Est
Sujss (51)e
Allemrds (30)., Slov.qra (24)6 Rouhâins (46)rq Esrclien! (20)e, Rusg (20)r
AnSlris(l?4)J, Hollandais (24)3, Deois (35)6 Sùédols (40). FinlùdÂis (54), S@i (28)e
Asie Cenrale et Méridionâlc
libéuirs (30).
Mor8ols (195), AibI (3t)ll
Géorgisrs (45)!, Even (65)ll, BouriaEs (81)ll, Hirdos(4?)1, Sri Lsnkeis (8!)t
Asic Orientale Jrponlis de OklnrM (45)t2 Jâponais de Sbidoks (61)12 Cotéetrs (29)l
Hrn Taiwmis (20), Sud.Est Asiadqus (38)t Chinoisdu Sud (59), Indonésie$ (51)r
Océanie Austrâliens (43). Néo-Guinéens (4E)4, Mélanesicns (37)E
Amérique Chêycnæs (45)ll, Gushibos (31)ll Navajos (55)lt
Figure 2.8
-
Fréquence relative (7o) de I'insertion Alu dans divers échantillons de populations humaines (taille des échantillons entre parenthèses). Références: 1: Spurdle et aL 1994;2: Passarino etal. 1998; 3: Quintana-Murci et al. in press;4: Hammer etal.1997i 5: Cooper et al. 1996; 6:
Malaspina et al. 1998; 7: Salem et al. 1996;8: Hammer et al. 1998; 9: Sajantila et al. 1996;
10: Stefanescu et al. 1997;
ll:
Karafet et al. 1997i l2: Hammer & Horai 1995; 13: Scozzari et al. tgg7b.E Adygei
Yakut
o
,Q Mandenka
ChineO Àsardaigne tr Géorgie Ethiooie
o--
A,hké"-"dû:+Hif'iHr Xâ," f^
O Tunisie Andalousie
4.5 O Algérie
t'noo4ol!.,4
",i!itîî,,
O Basque
-l
-2 -1.5 -l 4.5 0 0.5 1.5
ONiger-Congo O Basque
OAfro-Asiatique
I
OuraliqueAIndo-Européen lI Caucasien
OAltaique OSino-Tibétain
Figure 2.9
-
Analyse multidimensionnelle des distances génétiques (D = -ln[l-F5r]) entre3l
populations testées pour les polymorphismes YAP, DYSIg et YCAII (d'après Quintana-Murci et al. in press; Stress 2 = 0.210).2,4.L. Les haplotypes
du YAP
Conjointement ax polymorphisme
YAP,
plusieurs marqueurs dialléliques de mutations à des sites nucléotidiques ont été testés dans divers échantillons de populations humaines,afin
de déterminer des haplotypes duNRY. Le travail
le plus représentatif est sans doutecelui de Hammer et al. (1998) qui
observe,à l'échelle mondiale, l0 haplotypes
Y-spécifiques différents. Nous avons réanalysé ces données dans I'optique de permettre une comparaison avec
le
polymorphismep49a,flTaql. Au
préalable, nous avons réalisé une première analyse avec unjeu
de données provenant d'untravail
antérieur (Hammer et al.1997; Karafet et al. 1997), dans lequel seuls 5 haplotypes distincts sont observés, mais où lacaractérisation des populations est plus détaillée (48 échantillons de populations).
Figure 2.10
-
Haplotypes Y-spécifiques (d'après Hammer 1995) déterminés par le polymorphisme de l'élément AIu (YAP) et 3 sites nucléotidiques @N1, PN2 et PN3). Sont aussi rapportées les fréquences haplotypiques mondiales estimées sur un échantillon de 1500 chromosomes (répartition continentale des chromosomes testés: Afrique = 502, Europe = 384, Asie = 457,Océanie = 110, Amérique = 47).
Cet ensemble de données est le
produit
du typage de4
marqueurs (Figure2.I0): le YAP et 3
sites nucléotidiques polymorphes,PNl,
PN2 et PN3,qui ont
étéidentifiés lors
du séquençage d'un segment de 2.6 kb couvrant la région de I'insertionAIu (Hammer
1995).Par le séquençage de la région homologue chez des chimpanzés, Hammer (1995) a aussi proposé une phylogénie de ces
5
haplotypes:I'haplotype
1, sur lequel l'élémentAlu
est absent, serait ancestral; delui
dérivent, d'une partI'haplotype2
(transitionG-A
à PN3), et d'autre part I'haplotype 3 (insertion A/a), puis4
(transitionC-T
à PN2), puis 5 (transitionc-T
àPNl).
Le
niveau dedifférenciation
des populations estimé par Fsr est de 0.488(P <
0.0001).Cette
valeur
élevée deF ,
est expliquée, en grande partie, par unedifférenciation forte
des échantillonsd'Afrique
sub-saharienne. Eneffet,
dans ces derniers I'insertionAlu
esttrès
fréquente,alors que
dansla plupart
des autreséchantillons, elle est rare, voire
absente.Ainsi,
-55Vo desF t
par paires entre les 39 échantillons de populations autresCentromère DYS287 PAR2
PNII AluI PN2 PN3
2.6 kb
haplotypes fréquences mondiales
YAP. 2
I cc c
c AG
1.5 69.1 YAP+ 3
4 5
c c
T + + +
c
T T
G G G
6.8 8.0 14.5
que ceux
d'Afrique
sub-saharienne ne sont passignificativement
différentes de zéro, au niveau 5Vo. Ceci dans les données disponiblespour
I'analyse(i.e.
Hammer etal.
1997;Karafet et al. 1997). Cependant, comme I'indique la Figure 2.8, des
fréquences importantes de I'insertionAIu
sont aussi observées enAfrique
duNord
et enAfrique
de I'Est, ainsi qu'au Proche-Orientet
dansle
bassin Méditerranéen. D'autre part,la
Figure 2.8 semble aussiindiquer
que les variations de fréquencedu YAP+
intra-continentales sont substantielles(voir,
par exemple, la fréquence duYAP+
chez les Tsumkwe San).L'analyse