• Aucun résultat trouvé

Variabilité d'autres marqueurs Y-spécifiques dans les populations humaines Les premières études sur la variabilité de I'ADN mitochondrial humain ont suscité un

n EgYPtiens Æa

2.4. Variabilité d'autres marqueurs Y-spécifiques dans les populations humaines Les premières études sur la variabilité de I'ADN mitochondrial humain ont suscité un

intérêt de pair pour

la

variation génétique de la partie non recombinante du chromosome

Y.

La transmission de ces deux segments haploïdes du génome devrait en effet permettre

une reconstruction simple de la

généalogie des

variations.

Ces

phylogénies pourrait

éventuellement, à leur tour, être mises en relation avec la différenciation des populations humaines. Pour

le

moment, et malgré quelques tentatives (Hazout

& Lucotte

1986), une telle reconstruction n'est pas envisageable pour le système p49a,flTaql, car la nature des mutations associées aux variants est trop méconnue.

D'autres systèmes polymorphes spécifiques

du

chromosome

Y

sont recherchés depuis maintenant bientôt 20 ans, et d'une manière générale

il

apparaît que ce chromosome est moins variable que

le

chromosome

X ou

les autosomes. Des études de séquençage de grande envergure, du

point

de vue du nombre de nucléotides examinés,

ont ainsi

révélé un très

faible

niveau de

variation,

et certains chercheurs

ont

avancé I'hypothèse que le

chromosome Y avait expérimenté un ou plusieurs

épisodes

de "balayage sélectif"

(selective sweep), à travers lesquels se serait produite la

fixation

de certains variants dans la population

(Dorit

er

al.

1995;

V/hirfield

et

al.

1995).

Toutefois le faible niveau de polymorphisme caractéristique du

NRY

pourrait s'expliquer, peut-être pas uniquement, mais en tous cas en grande partie, par une

taille

efficace dans

la population

quatre

fois moins

grande que

celle

des autosomes

(Hammer & Zegura

1996).

Une

estimation actuelle de

la

densité des sites nucléotidiques ségrégants sur le

NRY livre

une proportion de 1 site polymorphe pour

-3'500

paires de bases

(Underhill

et

al.1997).

Néanmoins, contrairement aux pronostics des premières recherches intensives

de marqueurs RFLP sur le

NRY

(Ngo

& Lucotte

1986; Jakubiczka et

al.

1989; Malspina et

al.

1990; Spurdle

& Jenkins I992a),

de nombreux

polymorphismes

nouveaux

ont

été récemment identifiés, et continuent de

l'être. Ceci,

gràce à des technologies plus récentes et plus performantes de la

biologie

moléculaire, peut-être moins sensibles à la densité de séquences répétées qui caractérisent le chromosome

Y.

On dispose maintenant de plusieurs ensembles de marqueurs spécifiques du chromosome

Y

examinés dans diverses populations. Par exemple, une vingtaine de microsatellites du

NRY

sont connus, dont plus d'une dizaine sont testés de manière routinière en médecine légale (Kayser

et

al. 1997), et ont permis I'assemblage d'une grande base de données (de

Knijff et

al. 1997a, 1997b).

Le

microsatellite le plus étudié dans les échantillons humains est le

poly-GATA

du locus

DYS19. Celui-ci

est examiné

soit

isolément, soit en relation avec d'autres microsatellites ou d'autres marqueurs polymorphes moins variablesr.

I e.g. Roewer et al. 1992,1996; Muller et at. 1994; Ciminelli et al. 1995; Falcone er al. 1995; Hammer & Horai 1995; Pena et al. 1995;

Cooper et al. 1996; Deka et al. 1996; Jobling et al. 1996; Ruiz Linares et al. 1996; Sajantila et al. 1996; Salem et al. 1996; Sanrachiara Benerecetti & Semino 1996; Santos et al. 1996; Underhill et al. 1996; Zago et al.1996; Bravi et al . 1997;de Knijff et al. 199'l a, L997b:

Hammer et al.1997; Karafet et al.1997; Kayser et al.1997'Pérez-I*zaun et al. 199?b; Scorecki et al. 1997; Scozzari et al. 199?b;

Zerjal etal.1997; Bianchi et al. 1998; Kitrles er al. 1998; Quintana-Murci et al. in press.

L'analyse

de la variation

des locus

microsatellites

est complexe: I'homoplasie est une propriété inhérente à

leur

mode de

mutation

(e.g. Valdes

et al.

1993;

Di

Rienzo

et

al.

1994; Shriver et

al.

1995; Freimer

& Slatkin

1996),les taux de mutation de ces systèmes sont très élevés et pas forcément identiques

pour

tous les locus (Weber

& Wong

1993;

Cooper

et al.

1996;

;

Chakraborty

et al.

1997;

Heyer et al.

1997;

Kayser et al.

1997;

Bianchi

et

al.

1998;

Brinkmann et al.

1998).

On

a aussi

mis

en évidence I'existence de mécanismes de contrainte sur le nombre de répétitions portées par un locus microsatellite (Bowcock et al. 1994; Garza et

al.

1995).

Outre les microsatellites,

un

des polymorphismes spécifiques du

NRY

les plus testés est le marqueur

YAP

(Y AIu Polymorphic element)

identifié

d'abord par RFLP (Persichetti et

al. 1992) puis par PCR (Hammer 1994). Il s'agit d'un membre de la famille

des séquences

AIu, qui

est

soit

présent

(YAP+) soit

absent

(YAP-)

au locus

DYS287

dans

I'intervalle 50,

sur le bras

long

du chromosome. Les fréquences observées de I'insertion

AIu

dans différents échantillons de populations humaines sont rapportées dans la Figure 2.8.

Nous avons collaboré à I'analyse de

trois

systèmes polymorphes testés par

L.

Quintana-Murci et O.

Semino,

du laboratoire de S.

Santachiara Benerecetti, dans une trentaine

d'échantillons de populations. Il s'agit du YAP et de deux microsatellites, DYSl9

et

YCAII.

Comme

pour le

polymorphisme

p49a,flTaqI,

I'analyse de ces données, décrite dans le détail dans Quintana-Murci et

al. (in

press), suggère une relation étroite entre les

affinités

génétiques des populations,

leur

apparentement

linguistique

et

leur

localisation géographique (Figure 2.9).

Pour les systèmes

YAP, DYS19

et

YCAII

nous ne disposions pas des haplotypes; nous avons

donc adopté I'approche de traitement multi-locus décrite

dans

Michalakis &

Excoffier

(1996) pour inférer des distances génétiques entre paires de populations basées sur les

trois

marqueurs.

Le coefficient

de corrélation linéaire entre ces distances et celles

inférées

d'après

le marquew p4ga,flTaqI est de 0.83 (test de Mantel avec

10'000 permutations,

P < 0.001,

comparaison possible

pour

19

échantillons

de populations).

L'étude de Quintana-Murci et al. (in press) nous apporte donc une

confirmation

indirecte de

la

relation étroite, mise en évidence avec

le

marqueur

p49a,ilTaql

de

la

région DAZ, entre différenciations génétique,

linguistique

et géographique des populations, pour leur génome strictement paternel.

25 50 75 Fréquence de l'insenion Alu (%) :

Afrique Méridionalel @]

r--r ----]

E----Ambo(38), Xhosa (22) Himba (35), V€nd! (2?)

Zoulou (47), Swei (30), Pedi (52)

Îrw.n. (40), Dda (37)

rlE---E---]

Tsonsâ (30), Soùo (45), Hqqo (46) Nâm (23), Sek€le Sôn (45) l4nbâ (4?)

Trunlre Sin (38)

Afrique de I'Oust Wolofr(3lP

MÂndenkr (64)3

--1

n---'t

G.mbi6r

(4E).

Nie&tûs (23f

AfriquedEtEst I.-l c.ndes(29).

---T

Edrioplai(64P

Afrique du Nord

---]

r--..1 r---1

Mûqins (,|4)6 Algé.itu (33)l Egyptias (93).

r---..]

I---1

Tunisiqs (58)3 VrUér du Nil (l 53f

Proche Orient Libânô|5 (47), S4hûrd6 (43)l Iraquiens (45)!, Saoudiens (22).

Europe Méridionale G's(84I

Crl.brds (69), Albù.ir (49)l Sicitiens(52)3

Barqm (25)e, Sùd6 (90), Espr8nols du Sud (4t)6

r---l

Europe du Nord et de I'Est

Sujss (51)e

Allemrds (30)., Slov.qra (24)6 Rouhâins (46)rq Esrclien! (20)e, Rusg (20)r

AnSlris(l?4)J, Hollandais (24)3, Deois (35)6 Sùédols (40). FinlùdÂis (54), S@i (28)e

Asie Cenrale et Méridionâlc

libéuirs (30).

Mor8ols (195), AibI (3t)ll

Géorgisrs (45)!, Even (65)ll, BouriaEs (81)ll, Hirdos(4?)1, Sri Lsnkeis (8!)t

Asic Orientale Jrponlis de OklnrM (45)t2 Jâponais de Sbidoks (61)12 Cotéetrs (29)l

Hrn Taiwmis (20), Sud.Est Asiadqus (38)t Chinoisdu Sud (59), Indonésie$ (51)r

Océanie Austrâliens (43). Néo-Guinéens (4E)4, Mélanesicns (37)E

Amérique Chêycnæs (45)ll, Gushibos (31)ll Navajos (55)lt

Figure 2.8

-

Fréquence relative (7o) de I'insertion Alu dans divers échantillons de populations humaines (taille des échantillons entre parenthèses). Références: 1: Spurdle et aL 1994;2: Passarino et

al. 1998; 3: Quintana-Murci et al. in press;4: Hammer etal.1997i 5: Cooper et al. 1996; 6:

Malaspina et al. 1998; 7: Salem et al. 1996;8: Hammer et al. 1998; 9: Sajantila et al. 1996;

10: Stefanescu et al. 1997;

ll:

Karafet et al. 1997i l2: Hammer & Horai 1995; 13: Scozzari et al. tgg7b.

E Adygei

Yakut

o

,Q Mandenka

ChineO Àsardaigne tr Géorgie Ethiooie

o--

A,hké"-"dû:+Hif

'iHr Xâ," f^

O Tunisie Andalousie

4.5 O Algérie

t'noo4ol!.,4

",i!itîî,,

O Basque

-l

-2 -1.5 -l 4.5 0 0.5 1.5

ONiger-Congo O Basque

OAfro-Asiatique

I

Ouralique

AIndo-Européen lI Caucasien

OAltaique OSino-Tibétain

Figure 2.9

-

Analyse multidimensionnelle des distances génétiques (D = -ln[l-F5r]) entre

3l

populations testées pour les polymorphismes YAP, DYSIg et YCAII (d'après Quintana-Murci et al. in press; Stress 2 = 0.210).

2,4.L. Les haplotypes

du YAP

Conjointement ax polymorphisme

YAP,

plusieurs marqueurs dialléliques de mutations à des sites nucléotidiques ont été testés dans divers échantillons de populations humaines,

afin

de déterminer des haplotypes du

NRY. Le travail

le plus représentatif est sans doute

celui de Hammer et al. (1998) qui

observe,

à l'échelle mondiale, l0 haplotypes

Y-spécifiques différents. Nous avons réanalysé ces données dans I'optique de permettre une comparaison avec

le

polymorphisme

p49a,flTaql. Au

préalable, nous avons réalisé une première analyse avec un

jeu

de données provenant d'un

travail

antérieur (Hammer et al.

1997; Karafet et al. 1997), dans lequel seuls 5 haplotypes distincts sont observés, mais où lacaractérisation des populations est plus détaillée (48 échantillons de populations).

Figure 2.10

-

Haplotypes Y-spécifiques (d'après Hammer 1995) déterminés par le polymorphisme de l'élément AIu (YAP) et 3 sites nucléotidiques @N1, PN2 et PN3). Sont aussi rapportées les fréquences haplotypiques mondiales estimées sur un échantillon de 1500 chromosomes (répartition continentale des chromosomes testés: Afrique = 502, Europe = 384, Asie = 457,

Océanie = 110, Amérique = 47).

Cet ensemble de données est le

produit

du typage de

4

marqueurs (Figure

2.I0): le YAP et 3

sites nucléotidiques polymorphes,

PNl,

PN2 et PN3,

qui ont

été

identifiés lors

du séquençage d'un segment de 2.6 kb couvrant la région de I'insertion

AIu (Hammer

1995).

Par le séquençage de la région homologue chez des chimpanzés, Hammer (1995) a aussi proposé une phylogénie de ces

5

haplotypes:

I'haplotype

1, sur lequel l'élément

Alu

est absent, serait ancestral; de

lui

dérivent, d'une part

I'haplotype2

(transition

G-A

à PN3), et d'autre part I'haplotype 3 (insertion A/a), puis

4

(transition

C-T

à PN2), puis 5 (transition

c-T

à

PNl).

Le

niveau de

différenciation

des populations estimé par Fsr est de 0.488

(P <

0.0001).

Cette

valeur

élevée de

F ,

est expliquée, en grande partie, par une

différenciation forte

des échantillons

d'Afrique

sub-saharienne. En

effet,

dans ces derniers I'insertion

Alu

est

très

fréquente,

alors que

dans

la plupart

des autres

échantillons, elle est rare, voire

absente.

Ainsi,

-55Vo des

F t

par paires entre les 39 échantillons de populations autres

Centromère DYS287 PAR2

PNII AluI PN2 PN3

2.6 kb

haplotypes fréquences mondiales

YAP. 2

I cc c

c AG

1.5 69.1 YAP+ 3

4 5

c c

T + + +

c

T T

G G G

6.8 8.0 14.5

que ceux

d'Afrique

sub-saharienne ne sont pas

significativement

différentes de zéro, au niveau 5Vo. Ceci dans les données disponibles

pour

I'analyse

(i.e.

Hammer et

al.

1997;

Karafet et al. 1997). Cependant, comme I'indique la Figure 2.8, des

fréquences importantes de I'insertion

AIu

sont aussi observées en

Afrique

du

Nord

et en

Afrique

de I'Est, ainsi qu'au Proche-Orient

et

dans

le

bassin Méditerranéen. D'autre part,

la

Figure 2.8 semble aussi

indiquer

que les variations de fréquence

du YAP+

intra-continentales sont substantielles

(voir,

par exemple, la fréquence du

YAP+

chez les Tsumkwe San).

L'analyse

multivariée

réalisée sur les données des polymorphismes

YAP, PNl,

PN2 et PN3 met en évidence un axe géographique de variation des fréquences du

YAP+

(Figure

2.II). Quelques similarités avec la variation du

système

p49a,flTaql peuvent

être

observées: on retrouve une différenciation entre les échantillons Niger-Congo

et Khoisans, avec une grande hétérogénéité chez ces derniers; une

affinité

génétique entre les Dama et les

Niger-Congo;

une

différenciation

des Lemba, que I'on retrouve proches des Egyptiens;

enfin, un

regroupement des échantillons Indo-Européens.

En

revanche,

nous ne pouvons pas comparer les affinités

génétiques des

échantillons

Asiatiques observées pour ce système avec celles observées pour le marqueur p49a,flTaql, puisque, pour ce dernier, nous ne disposions que d'un échantillon Chinois. Cependant,

mis

à part

les

Japonais

et Tibétains,

I'ensemble des

échantillons d'Asie Orientale,

d'Océanie et d'Amérique

forment un

groupe

virtuellement fixé

sur un même haplotype (haplotype 1,