Polymorphismes de l'ADN et histoire du peuplement humain: apports de l'étude des marqueurs RFLP

(1)

Thesis

Reference

Polymorphismes de l'ADN et histoire du peuplement humain: apports de l'étude des marqueurs RFLP

POLONI, Estella S.

Abstract

Notre compréhension de l'histoire du peuplement humain provient, en grande partie, de l'étude de la variabilité génétique des populations actuelles. Ici, des marquers RFLP ont été utilisés pour détecter le polymorphisme humain au niveau de l'ADN. Deux ensembles de données ont été récoltés, puis analysés, et ont permis d'observer une forte corrélation entre les distances génétiques et les distances géographiques qui séparent les populations.

L'existence d'une telle corrélation suggère que les populations humaines ont maintenu, entre elles, des flux migratoires importants tout au long de l'histoire de leur diversification. Ces données suggèrent aussi que les populations humaines se sont différenciées génétiquement et linguistiquement de manière concomitante, car les affinités génétiques entre populations reflètent fortement les relations de parenté entre les langues qu'elles parlent. Si, comme le supposent actuellement les linguistes, la diversification des grandes familles de langues humaines est d'origine très récente, la différenciation génétique des populations humaines l'est [...]

POLONI, Estella S. Polymorphismes de l'ADN et histoire du peuplement humain:

apports de l'étude des marqueurs RFLP . Thèse de doctorat : Univ. Genève, 1999, no. Sc.

3079

DOI : 10.13097/archive-ouverte/unige:101908

Available at:

http://archive-ouverte.unige.ch/unige:101908

Disclaimer: layout of this document may differ from the published version.

1 / 1

(2)

!.]rHsrÊ

^DE^GEÈ'lEvE

UNwBRstrÉ oe GeNÈvn

Département d' anthropologie et d'écologie

FecuItÉ

DES SCIENCES Professeur

A.

Langaney

Dr L. Excoffier

Polymorphismes ^de I'ADN ^et histoire du peuplement humVin: apports de l'étude des

marqueurs RFLP

THÈSE

présentée

à

la Faculté des sciences de I'Université ^{de Genève} pour obtenir le grade de Docteur

ès

sciences, mention biologique

par

Esrnlle SnrloNnrra POLONI

de

Genève et Orbetello (Iret.re)

Thèse No 3079

GeNrÈve

1999

(3)

(4)

Département ^d'anthropologie et d'écologie Professeur

A.

Langaney

Dr L. Excoffier

Polymorphismes ^de I'ADN ^et histoire du peuplement humain: apports de l'étude des

marqueurs RFLP

THÈSE

présentée

à

la Faculté des sciences de I'Université de Genève pour obtenir le grade de Docteur

ès

sciences, mention biologique

par

Esrella SnraoNptra POLONI

de

Genève et Orbetello (Irerm)

Thèse No 3079

GBNÈvB

1999

(5)

docteur et codirecteur de thèse (Déportement d'onthropologle et

^écotogie),

J.

BERTRANPEIIT,

profeseur

(Université

de

Pompeu

Fobro,

Unité

de biologie

évolutive

-

Borcelone, Espogne) et Y.

MICHALAKIS,

docteur

(Unlverslté

piene et ^Morie

Curle,

Loborotohe fonctlonnêment et évolutlon des

systèmes

écologlques -

^Porls,^Fronce),

outorise I'impreslon

de lo

présente thèse, sons exprlmer

d'oplnlon sur les

propositions qui y sont énoncées.

Genève,le 7 mol 1999

Thèse - 3079 - ûlUJ'!-

Le

Doyen,

Jocques wEBER

(6)

Entre I'apprentissage du "métier", I'appui logistique et le soutien

constant, nombreuses,

très

nombreuses,

sont les

personnes, collègues, parents

et amis, qui m'ont

aidée dans

la

réalisation de cette thèse. Cette page et toute ma gratitude

leur

sont dédiées.

Pour mener ^àbien ce travail,

j'ai

bénéficié de la confiance de mon professeur et ami, André Langaney, co-directeur de cette thèse. Je

lui

dois avant

tout d'avoir

éveillé ma curiosité à cette

discipline

particulière qu'est la génétique des populations humaines,

puis

de

m'avoir offert

^les

conditions

idéales

pour poursuivre ma formation

en me spécialisant dans ce domaine. Son sens

critique,

ses dons pédagogiques, sa culture et sa patience à toute épreuve

m'ont

accompagnée

tout

au

long

de ces années, et si

j'ai

pu parfois le

dépasser,

ce n'est que sur une longueur de crawl particulièrement

soutenu.

Laurent

Excoffier,

co-directeur de cette thèse, a assuré

le suivi

des diverses étapes qui ont permis I'aboutissement de ce

travail,

et a ainsi généreusement contribué à ma

formation. En orientant mes lectures et à travers d'innombrables

séances de

"brainstorming" ou

de

rires, il

^asu me

faire profiter

de son

esprit créatif

et de ses connaissances scientifiques précises, qui ont amplement stimulé mes recherches.

Les

membres

du jury,

Jaume

Bertranpetit, de I'unité de Biologie Evolutive

de

I'Université Pompeu Fabra à Barcelone, et Yannis Michalakis, du laboratoire Fonctionnement et Evolution

des Systèmes

Ecologiques, de I'Université Pierre

et

Marie Curie à Paris, m'ont fait I'immense plaisir d'accepter avec gentillesse

de participer à

l'évaluation

de cette thèse.

Les conseils

^avisés

et l'amitié de David Roessli et Alicia

Sanchez-Mazas ont imprégné ce travail. Leur

disponibilité

à répondre ^àmes FAQs trop fréquentes et leurs compétences

dans de nombreux domaines, de la ^génétique à I'informatique,

en passant

par la

statistique

ou la

paléoanthropologie,

ont

été

un soutien

inestimable durant toutes ces ^années.

Ce travail n'aurait pas vu Ie jour sans le précieux concours de

nombreuses personnes, chercheurs

ou non, et tout d'abord celui

^des

habitants

des

villages

de Batranke, Bantata, Banion, Barraboy et

Tikankali,

dans le Département de Kédougou, au Sénégal

Oriental.

Je remercie sincèrement tous ces généreux donneurs que

je

ne connais, malheureusement, qu'à travers quelques uns de leurs ^gènes.

(7)

collection d'échantillons d'ADN

sur laquelle

j'ai

par

la

suite

travaillé. J'ai pu

ainsi

profiter

des ressources et de

I'aide

bienveillante de Barbara Kervaire, Etienne Roux, Xiaowen Shi-Isaac et Patricia Roux.

Luca Cavalli-Sforza, en

m'accueillant

chaleureusement comme

il I'a fait

au sein de son équipe cosmopolite, au Département de Génétique de

I'Ecole

de

Médecine

de I'Université de Stanford,

m'a offert

l'occasion de me

familiariser

avec

le

"monde _du

laboratoire" en

anthropologie

moléculaire.

J'ai

tiré,

de ce séjour

riche

en échanges

avec la communauté scientifique, d'innombrables enseignements, et je

suis particulièrement redevable pour

leur

aide précieuse et constante à Joanna Mountain, Joachim Hallmayer et

Alice Lin,

ainsi que Joan Hebert, Berta Young et

Eric Minch.

Mes remerciements affectueux

vont

aussi à Silvana Santachiara Benerecetti

et

ses

collègues, du Département de Génétique et

Microbiologie

de

I'Université

de Pavie,

dont Ornella

Semino, Giuseppe Passarino

et Lluis Quintana-Murci. La

confiance qu'ils m'ont accordée a constitué un terrain idéal pour notre collaboration.

Au

sein même de notre Département, I'assistance de chaque

jour

et

I'amitié

de mes collègues

du Laboratoire

de Génétique et

Biométrie,

a été une source constante de

motivation. Un grand merci

à

Patricia Dard,

Isabelle

Dupanloup, Mathias

Currat,

Ninian Hubert van Blyenburgh, Alexandra Mossière, Nicolas Ray et

Stefan Schneider, ainsi qu'à mes anciens collègues et amis du présent, Béatrice

Pellegrini

et Laurent Graven.

Tous les membres du Département d'Anthropologie _etd'Ecologie, à commencer par son directeur,

Alain

Gallay, mais aussi Marie-Noëlle Lahouze Davaud et Jean-Gabriel

Elia,

Corinne de

Haller, Leila

Gaudé et

Marisa Andosilla Ruggeri, ainsi

que Serge Aeschlimann, Jacques Koerber, Olga Petrovic, Georges Puissant et

Yves

Reymond, m'ont gentillement _apporté,à différents moments, une aide essentielle.

Je tiens à remercier le Fond

National

Suisse pour la Recherche Scientifique dont le soutien a assuré I'accomplissement des projets de recherche qui ont stimulé ce travail.

Et puis, bien-sûr,

il y

a mes proches, qui _onttoujours soutenu mes choix, mes deux

soleils, Agus

et

Lluna,

mes amis

fidèles,

tous ces

formidables baby (et mummy)

- sitters, sans I'aide desquels ce

travail

aurait mis encore longtemps à recevoir son

point

final.

(8)

(9)

(10)

Introduction

^générale

1.

Variabilité

de

I'ADN

nucléaire dans

an échantillon

de

Mandenkalu du

Sénégal

Oriental

1.2. Le polymorphisme de longueur de fragments ^de

restriction

I .2.

l.

De scription ^{de s}polymorphismes étudiés 1.2.2. Protocole de typage des RFLPs

1.2.3. Fréquences alléIiques des RFLPs 1.2.4. Echantillons de populations déjà testés

pour

les RFLPs nucléaires 1.3. Description des données

1.3.1. Génotypes observés chezles Mandenknlu

L3.2.

Fréquences des aIIèIes observés chez les Mandenkalu 1.3.3. Effectifs des échantillons

1.4. Analyse statistique de la

variabilité

génétique des marqueurs nucléaires

1.4.1. Polymorphisme et diversité génétique 1.4.2. Test de

I'équilibre

de Hardy-Weinberg 1.4.3. Test de Ia neutralité sélective

d'un

locus

1.4.4. Variance des fréquences alléIiques ^entrepopulations 1.4.5. Distances génétiques entre paires de populations 1.4.6. Relation entre distances géographiques

et distances génétiques 1.5. Discussion des résultats

1.5.1. Détection du polymorphisme RFLP

I

3

6

7

I2

15

16 T8 18 18

27

29 29 34 37

4I

47

52 60

6I

1.5.2.

Equilibre

de Hardy-Weinberg et neutralité des systèmes 64

(11)

1 . 5.4.

Différenciation

^génétique des p opulations

1.5.5. Origine du polymorphisme et biais d'échantillonnage 1.5.6. Perspectives

2.

Variabilité

du polymorphisme

p49a,flTaql

dans ^les

popalntions

humaines 2.1.

Introduction

2.2. Description du chromosorne ^Yhumain 2.2.1.

Lafamille

de gènes

DAZ

2.3. Analyse de

la variabilité

de p49a,f/Taq

I

dans les populations humaines

2.3.1. Résumé de I'étude 2.3.2. Publication de I'étude 2.3.3.

Erreurs

2. 3.4. N ôûvêaux haploty ^pês p49

a,f/Taql

2.3.5. Déséquilibre de

liaison

2.4.

Variabilité

d'autres marqueurs Y-spécifiques dans Ies p opulations humaine s

2.4.1. Les haplotypes dUYAP 2.4.2. Les polymorphismes

DHPLC

2.5. Discussion

Conclusion générale

Bibliographie

80 68 74

96 96

r00

122 124 125

129 133 143

r48

159 167 193 83 85

9l

Annexe

I

I.I.

Nomenclature et

taille

des allèles répertoriés

pour

80 polymorphismes RFLP

1.2. Génotypes de l'échantillon Mandenka

pour

80

r93

polymorphismes RFLP 197

(12)

Introduction ^générale

Si la constitution

de

la

molécule

d'ADN,

notre

patrimoine

héréditaire, atteste notre appartenance

à une

espèce

unique,

I'espèce

humaine, la variabilité naturelle

entre

individus qui

caractérise

ce patrimoine porte les

^marques

de I'histoire individuelle

et populationnelle des ancêtres qui nous I'ont transmis.

Le travail ^que

nous présentons

ici s'inscrit

dans

un

ensemble

de

recherches

visant

à

décrire la diversité

génétique des

populations

humaines,

et à interpréter leur

^histoire

passée

par

une approche

interdisciplinaire, faisant

appel

à

des domaines d'étude aussi divers que la linguistique diachronique, I'archéologie, la paléoanthropologie, I'ethnologie, et bien sûr la génétique des populations.

Plusieurs stratégies sont envisageables dans

ce

genre de recherches,

dont

deux seront

illustrées par les

deux études

qui

composent ce

travail. Celles-ci ont pu

être réalisées grâce à deux opportunités

qui

nous

ont

été offertes: une

collaboration

avec l'équipe du Prof. Luca Cavalli-Sforua de

l'Université

de Stanford, et une autre avec l'équipe du Prof.

Silvana Santachiara Benerecetti de I'Université de Pavie.

Dans la première étude, la variation de nombreux locus

génétiques

(portions de

la molécule

d'ADN),

localisés sur presque tous les chromosomes, ^aété caractérisée dans un

très petit nombre d'échantillons de populations

^humaines.

Dans la

seconde étude en revanche, nous n'avons considéré

qu'un

seul marqueur,

porté par le

chromosome

Y

et transmis uniquement par

la voie

paternelle, mais dont

la variabilité

a été examinée dans de nombreuses populations.

Si ce

travail

est composé de deux études, différentes par certains aspects, celles-ci visent

néanmoins à répondre à une même question: à quel point et de quelle ^manière

^les populations humaines se

différencient-elles

les unes des autres lorsque

leur variabilité

génétique est examinée au niveau de la molécule

d'ADN

?

(13)

Dans les deux études, la variation de la séquence génomique entre

individus

était détectée

par la

méthode

RFLP, et

nous avons

profité de la première

étude

pour

présenter _les aspects méthodologiques et les outils d'analyse auxquels nous avons

fait

appel.

Le patrimoine

génétique des

individus constitue donc notre "matériel" d'étude,

mais I'approche

évolutive qui

est I'essence de la génétique des populations prend précisément comme unité de base les populations. Quels sont les

profils

génétiques que I'on rencontre dans les populations, et avec quelles fréquences ?

Après avoir

répondu

à

ces questions,

on peut

évaluer

à quel point les populations

se ressemblent

ou

se

différencient

et proposer,

pour

rendre compte des observations, des hypothèses

sur I'histoire

des segments

du

génome analysés,

puis, par extension,

sur I'histoire des populations. Dans les deux études

qui

constituent notre

travail,

nous avons tenté de proposer des hypothèses

d'évolution

des populations en nous appuyant sur des

informations

externes,

d'ordre non

génétique,

comme la

géographie des populations humaines

ou

les relations historiques, connues

ou

supposées, entre les langues qu'elles parlent.

L'extension de

I'histoire

des segments

d'ADN

à

I'histoire

des populations est différente dans les deux études que nous avons entreprises.

Si

une

population

est soumise à un même processus démographique

(effet

fondateur,

migration,

expansion), _ses

effets

au niveau du génome peuvent être cependant fortement variables d'un

locus

à

un

autre.

A

cela s'ajoute encore la variation produite par d'autres phénomènes, dont la recombinaison,

la mutation ou la sélection. De ce fait la première étude nous permet d'évaluer la

variabilité génétique "moyenne" entre populations, alors que la

seconde

étude,

plus détaillée en termes d'échantillons examinés, ne nous permet cependant que d'interpréter I'histoire d'un seul locus génétique.

(14)

Variabilité de I'ADN nucléaire dans un échantillon de

Mandenkalu du Sénégal Oriental

1.1.

Introduction

Observer la variabilité génétique directement au niveau de

la

séquence

d'ADN

est devenu possible, vers la

fin

des années septante, par des développements techniques en

biologie moléculaire qui ont permis, notamment, la mise en évidence

^de polymorphismes de longueur de fragments de restriction (RFLP, en anglais).

En

1980, Botstein

et al. publient un travail

dans lequel

ils

démontrent

l'utilité des

marqueurs

RFLP

à l'établissement d'une cartographie du génome humain (Botstein

et al.

1980).

On estimait alors que la densité

de

sites génomiques ségrégents était

de I'ordre de I pour 200 à 500

paires de bases

(les

estimations actuelles

sont du même ordre;

on pourra consulter par exemple

Zietkiewicz et

al. 1997): une source immense, donc, de marqueurs génétiques potentiels

parmi

les quelques trois

milliards

de paires de bases

qui

composent

le

^génome

humain. I-es

répercussions

en

génétique médicale sont

d'ailleurs clairement

évidentes:

la localisation de

gènes responsables

d9

maladies héréditaires

devient possible grâce à l'étude de la

ségrégation

de ces

multiples marqueurs dans des généalogies (pour une revue, consulter V/hite

& Lalouel

1988).

I-e potentiel que

représentent

les

marqueurs

RFLP pour l'étude de la

variabilité génétique des populations humaines est très vite reconnu.

Il

est

mis

en application, dès

le

début des années quatre-vingt, notamment

pour l'étude du

génome mitochondrial (Johnson et

al.

1983) et de la région de

la

B-globine (Wainscoat

et al.

1986). Durant cette même période, le

Prof. L.

Cavalli-Sforza et son équipe, en collaboration avec le laboratoire

du Prof. K. Kidd,

conçoivent le

projet d'étudier la

variabilité autosomique

du

^génome

humain

dans son ensemble (Cavalli-Sforza

et al.

1986).

A

cette

fin,

ils sélectionnent

un

ensemble

de polymorphismes à

tester

parmi les quelques

1'000

(15)

RFLPs identifiés vers le

milieu

des années quatre-vingt, en prenant soin de représenter

le plus

grand nombre possible d'autosomes.

Un

ensemble

de 100

polymorphismes

(dont 99 RFLPs) a

ainsi été testé

à

I'occasion

d'une

première étude

portant sur

la

variabilité

observée

dans cinq

échantillons

de populations humaines:

Européens, Chinois, Mélanésiens, Pygmées

Bi-Aka,

et Pygmées

M'buti (Bowcock et al.

1991b, (prêcédé de Bowcock et

al. 1987, I99la).

Cet ensemble

original de 99 RFLPs a

été ensuite légèrement

modifié,

et réduit à environ 80, pour le typage de

trois

échantillons supplémentaires: Japonais, Néo-Guinéens, et Aborigènes Australiens

(Lin et

al. 1994).

C'est ce même sous-ensemble de RFLPs (quasiment) que nous avons caractérisé dans l'échantillon de Mandenka du Sénégal Oriental.

Les études mentionnées ci-dessus @owcock ^etal.

199lb,1987, I99Ia; Lin et

al. 1994)

ont

porté I'accent

sur I'observation d'une forte

différenciation entre

les

populations d'origine Africaine et les populations provenant d'autres continents. Les analyses de ces chercheurs les amènent à conclure que: "... la plus ancienne divergence dans I'évolution humaine a séparé les Africains et les non-Africarzs.

"

^(Bowcocket

al. 199lb,

p. _839).

Dans ces

analyses, cependant,

le

continent

Africain n'est

représenté

que par

deux échantillons de populations Pygmées, un échantillonnage

qui

ne permet, en aucun cas,

de rendre compte de la variabilité

génétique intra-continentale

mise en

évidence,

notamment, dans Excoffier et al. ⁽¹⁹⁸⁷⁾ ou Cavalli-Sforza et ^al. ^(1994).

Les populations Pygmées

d'Afrique,

confinées dans

la forêt

équatoriale

vivent par

petits groupes

d'une

économie dominée

par la

^chasse,

la

cueillette,

et le troc avec

les populations avoisinantes, en général Bantoues ou Nilo-Sahariennes.

Même si un

degré de métissage

parfois important

avec leurs

voisins

est supposé

pour

certains groupes Pygmées,

on

peut observer

qu'ils

_sedifférencient des autres populations Africaines dans les analyses de polymorphismes

dits

classiques

(Excoffier et al.

1987,

Cavalli

Sforza et al. 1994).

Dans ces conditions,

il ^nous a

semblé

important de

tester

les polymorphismes

de

l'ADN nucléaire sur une autre population Africaine, non Pygmée, et

^plus

spécifiquement sur une population plus importante tant du

point

de vue démographique que linguistique. Nous disposions d'un tel échantillon, prélevé chez les Mandenkalu (ou Malinkés) du Niokholo, au Sénégal Oriental, une des populations locutrices des langues Mandingues

d'Afrique

Occidentale. Des informations plus détaillées sur la population dont

provient l'échantillon pourront

être trouvées dans Langaney

& ^Gomila

^(1973),

Lalouel

&

Langaney (1976), Langaney etal. (1979) et

Dard

(1991). Dans

Dard

(1991)

(16)

on trouvera aussi une description

de la

campagne de prélèvements sanguins

et

de la mise en culture cellulaire de lignées lymphoblastoïdes à

partir de

laquelle nous avons obtenu de

I'ADN

en grandes quantités. Une collaboration entre notre laboratoire et celui de

L.

Cavalli-Sforza, entre 1991

et

1995, nous ^apermis de mener à bien ce projet, dont les principaux résultats ont été publiés (Poloni et

al.

1995).

(17)

l.2.Le polymorphisme

de

longueur

de

fragments

de

restriction

Iæ principe de détection des RFLPs repose sur la spécificité de

réaction d'endonucléases d'origine bactérienne. Chaque endonucléase, ou enzyme de restriction, reconnaît une séquence

d'ADN

spécifique, longue de quelques nucléotides, se

lie

à elle et

la

coupe.

Une simple

substitution nucléotidique

à ce site de

reconnaissance, tout comme une insertion

ou

une délétion d'une

ou

quelques paires de bases, entraîne sa disparition, et la réaction de clivage ne se produit pas.

Il

en résulte que la longueur des fragments

de restriction de

chromosomes homologues

va varier en fonction de

la présence

ou de

I'absence

de

sites

de

reconnaissance

pour le clivage

enzymatique.

Notons qu'une autre source de variation peut

surgir du fait qu'une

séquence

d'ADN

répétée en tandem

un

nombre variable de

fois (VNTR,

en anglais) soit comprise entre deux sites de reconnaissance

d'un

enzyme:

le nombre

de repétitions contenu dans le

VNTR

étant par

définition

variable,

la

longueur des fragments générés

par le

clivage enzymatique

va refléter cette variation. De même, des insertions, délétions,

ou réarrangements de séquences, dans une région génomique comprise entre deux sites de clivage enzymatique, peuvent entraîner I'apparition de fragments de restriction de tailles variables.

Enfin,

les clivages enzymatiques peuvent aussi générer des fragments non polymorphes, qui sont alors qualifiés de "constants".

Chaque enzyme de restriction peut rencontrer une multitude de sites de reconnaissance spécifique ^àtravers un génome.

Il

s'agit donc de cibler la séquence génomique (locus) à étudier. Ceci est réalisé grâce à l'isolement d'une séquence complémentaire (sonde) à la séquence

d'ADN du

locus d'intérêt.

En

général,

les

sondes sont choisies au hasard dans une

librairie

de fragments

d'ADN

clonés représentant le génome au complet.

Letypage

d'un RFLP

s'effectue de la manière suivante

(Figure

1.1):

on

désire étudier un locus spécifique de

I'ADN, qui

contient

un

site de reconnaissance pour

un

enzyme de restriction donné

QCGA

^{dans la}

figure). On

dispose d'une sonde dont la séquence est complémentaire de celle du locus,

ou tout

au

moins

en partie.

L'ADN total d'un individu est

digéré

par I'enzyme de restriction; il en

résultera

donc de

^nombreux

fragments

d'ADN

de longueurs différentes.

On

applique alors la méthode de Southem (1975): les fragments sont séparés

par

électrophorèse, dénaturés,

puis hybridés à

la sonde. Le marquage radioactif de celle-ci permet la révélation (sur

film)

de la longueur des fragments de restriction générés au locus. Dans la figure,

le

clivage enzymatique du

(18)

chromosome

A

conduit ^àI'observation

d'un

fragment court, alors

qu'un long

fragment

est

observé

pour le

chromosome

homologue B, car une substitution (T-C) a

^fait

disparaître le site de reconnaissance ^deI'endonucléase.

Figure 1.1

-

^Principede détection du polymorphisme de longueur de fragments de restriction

1.2.1

Description

des

polymorphismes

étudiés

L'ensemble des polymorphismes de longueur de fragments

de restriction que

nous avons analysé est rapporté dans la Table 1.1. Chaque polymorphisme est

défini

par la

combinaison d'une sonde (clone) et d'un enzyme de restriction. Au total,

80 polymorphismes

ont

été testés

sur 58 locus,

dont

32

correspondent

à

des clones de gènes

connus.

l.e,s

26 polymorphismes

restant

proviennent de clones

anonymes (segments

d'ADN

sans fonction connue). Ces derniers sont aisément reconnaissables par leur nomenclature: la lettre

D

suivie du numéro du chromosome,

suivi

de la lettre S

et

d'un numéro

spécifique. Par exemple,

sur le

chromosome

2,

nous avons testé le polymorphisme de clivage enzymatique de I'endonucléase

MspI

au segment anonyme D2S1 (marqueur

lp,

Table 1.1).

+locus*

chromosomeA

-TCcA-

Tcce

-

TccA-

sonde

-

chromosome

B. -

TccA

-

Crcn

-

TCGA

-

B

-

sens de la migration électrophorétique

A

(19)

Table

1.1

-

^Liste^despolymoqphismes étudiés".

No.b

^Locus

(HUGO)

Localisation

Statut" Sonde Enzyme

Variationd 1d

2d 3d 4d 5d

lp

6d 7d 8d 9d 10d 2p

ltd

3p

l2d

4p l3d

5p

r4d

15d 16d

t7d l8d

19d 6p 7p 20d 8p 9p

2td

22d lop 23d

llp

24d 25d 26d 27d 28d 29d 30d

3ld 32d 33d

lp13.1

2pl2

2p23 NGFB

CDSA POMC

ERV3

D7S8

COLlA2 TCRB CPAl

D7S18 PGY3 MET

D7S13 PLAT ABLI D10520 D11S42l APOAI A2M

coL2Al

IGFl

coL4Al

2p25

3p21.3-3p2r.2 4q2I-4q23 4q28 SpI4-5p12 Sqrl.2-5q13.2 6q27

7p22-7p15

L2.30 H3H2 pADH36 pAFl

pghr.501 pDHFR-1.8 p2-2 pA2H3

HRz PTIO p184 7C22 pMDR2 pmetD pmetH pmetH pB79a ptPA4352 pablK 2 os-3

p19.2

pApoAl

pha2m1

RsaI SsrI MspI Hindm

RsaI Taql BsrM ScrFI PvUII Hinfl Hindln

EcoOl09 Mspl

Bsfi Mspl TaqI Mspl

RsaI

Ben Bsn

EcoRI MspI TaqI TaqI MspI Hinàfn,

EcoRI TaqI TaqI SsrI Xmnl PvUII TaqI EcaRI EcaRV HinfI Betil Haeln Hindm Hindm XmnI C

c c

5'sub

^Bg/[J

TaqI pcDl-eu2-14 DraI pP2

D2S1

APEH (D3F15S2) ADH2

FGA GHR DHFR D6S2 DTSI

NC

c c c c

C NC NC

IL6

7pl2-7qlI 7p2t-7p15 7q3L

7q21.3-7q22.1 7q35

7q32

7q3l.t-7q31.2 7qLl

7q3L

7q.22.3-7q3t.2 8p12-8p1 I

9q34.r r0q22-10q26

1 lpter-1 lqter Itq23.3

I2pt3.3-12pt2.3

l2ql2-12q13.2 12q22-12q23 13q34

pHPl.7 pBeta2.15

NC

^pJ3.1l

C

c

?

c c

C

c c

NC

c c

NC NC

c c

DEL INS

2 ,|

c c c

pgHColIIA cD10 HT21

(20)

No.u

Locus

(HUGO)

Localisation

Statutb Sonde Enzyme

Variation"

34d 35d

r2p

36d 13p 37d 38d 39d 40d 41d 42d 43d 44d 45d 46d 47d 48d 49d 50d

5ld

52d 53d

54d 55d

l4p

56d 57d s8d 59d 60d

6td 62d 63d 64d 6sd 15p

RBI ^NC

NC NC C NC NC NC NC NC NC

c

NC NC NC NC NC NC NC

c

NC NC

HindtrI Hinfl

HaeIIL Bam.III Dral TaqI Bann Hindm

Bgfi

Dral TaqI Dra|

Taql Xmnl TaqI Xrnnl Mspl HphI MspI Taq|

Hindm BgN BamIil, Mspl Pvull Betil Hindil, HincI\

Bg'J

Bsn

PstI SstI

Bam\il Pstl Hindm

Bgln D13534

ESD D1355 Dl3S7 DL3S22 D1351 D13510 Dr356 COL4A2 Dl3562 DI3S2 Dr3S26 D13S4 D13S41 D1353 Dl4531 HP D17S71

l3ql4.3

13q14.3 13q32-13q33 I3qr4.t-13q14.2 13q31

13q22

l3ql4

13q13

13qI4 t3ql2.3 13q34 13q13-13q14.1 13q22

r3q2l.l-I3q21.2

13q31

t3q2l

13q34 l4pter-l4qter

16q22.2

l7pIZ-l7pIL2

pHUl0 HT39 pL28-5

p9Dll

pH2-10 P1E8

wc83

p9A7 p18-1 hp2-alpha pA10-41 p123M1.8 p68RS2.0 pCR1330 ET-22 pHuB8 pHU26 pG14El.9 p7F12 p7D2

LEV/301 pHtk9 c-H800

p83.1 pca ps2 22CL-18 v-sis pMS3-18

VP VNTR

(r)

(D

INS

D17558 TKI GH

sLC4Al

^(EPB3) c3

TFF1 (BCEI) D22S10 PDGFB D22SI

17plL2-l7cen 17q23.2-t7q25.3 r7q22-17q24

17ql2-l7q2l

19p13.3 21q22.3

22qll.L-22q11.2 22q12.3-22q13.1

22qll.2-22q12

c

2

c

C

c

NC

c

NC

" Les références aux sondes utilisées sont rapportées dans Bowcock et al. (1987, ^1991a)et Lin et al. (1994). Les polymorphismes sont numérotés d'après Poloni

et

al. (1995). Cette table

a

été complétée par des informations trouvées dans les bases de données publiques suivantes: "The Genome Database" (GDB : http://gdbwww.gdb.org/) et "Online Mendelian Inheritance

in

Man"

(OMIM: hup://www.ncbi.nlm.nih.gov/Omim/). ^bd: diallélisme; p: pluriallélisme. ^bC: localisation certifiée par le comité GDB; NC: localisation ^proposée^parla soumission originale à GDB, ^mais non certifiée. ^dAucune mention dans cette rubrique signifie que

le

type de variation du ^RFLP n'est pas défini; DEL: délétion; INS: insertion; VP: variation ponctuelle; ?: ne figure pas ^dans GDB; (I): "upper system"; (II): "lower system".

(21)

La liste de marqueurs

nucléaires présentée

dans la Table 1.1 appelle

plusieurs commentaires ou précisions ^:

1) Le statut de locus "anonyme" peut être transitoire, et ne refléter parfois que l'état des connaissances; dans notre étude, le locus D3F15S2E, anonyme au moment

du

test, est aujourd'hui reconnu

comme le

gène

APEH

(N-acylaminoacyl-peptide hydrolase).

A

noter aussi

qu'un

clone (une sonde) dérivé

d'un

gène peut englober ce gène en entier, ne correspondre

qu'à

une partie seulement de celui-ci,

ou

encore se

trouver à

cheval entre le gène et une région flanquante à celui-ci.

2)

Tous les autosomes sont représentés par au moins un marqueur,

à

I'exception des chromosomes 15,

l8

et20. Certains chromosomes sont cependant bien

mieux

couverts que d'autres; les chromosomes

7 et

13 totalisent à eux seuls près

de la moitié

^(49Vo)

des polymorphismes

testés,

et les polymorphismes des chromosomes 12 et

¹⁷

représentent

un 2l%o

supplémentaire.

Cette situation découle directement de

la disponibilité en marqueurs nucléaires

qui

caractérise

les

années quatre-vingt: certains chromosomes (comme

le 7, le 12,le

13 et

le

17) étaient

I'objet d'un

intérêt spécial en

raison de leur

candidature

à être porteurs de

gènes responsables

de

pathologies congénitales,

comme la

maladie de

V/ilson ou la

mucoviscidose,

pour ne citer

que celles-ci. On peut résumer la représentativité de chaque chromosome dans cette étude par la Table 1.2.

Table

1.2

-

Répartition autosomique des marqueurs étudiés Marqueurs sur locus:

Chromosome

codant anonyme

^Total

I

2 3 4 5 6 7 8 9 r0 1l

12

t3 t4

16

t7

19 2L 22

a J

t

1

2 l1

1

I

1

9 8

I

5

I

1

I

l

; :

1

I t4

1

J

;

a 4

1

a 2

1

t7

1 1 1

2 9 22

I I

8

I I

3

Total 50 30 80

(22)

3)

La possibilité que certains marqueurs soient

en

déséquilibre

de liaison n'a

pas été clairement examinée

(Bowcock et al.

1987;

Mountain & Cavalli-Sforza

1997). Cette situation est

tout

à

fait

possible pour

un

certain

nombre

de

polymorphismes

localisés

sur le

même chromosome,

ou pour

des

locus dont on a

testé

les

polymorphismes correspondant à plusieurs endonucléases distinctes.

Par

exemple,

sur le

chromosome 12, le locus

A2M n'est

hybridé que par une unique sonde, mais

il

est examiné ave*,7 endonucléases différentes.

Figure

1,2

-

Localisation cytogénétique des dix-sept locus analysés sur

le

bras

long

du chromosome 13.

l3ql I

l3qr2.It

13q12.12

t3ql2.l3 t3ql2.2 l3qI2.3

13q13.1

t3qt3.2

13q13.3 13q14.1 I

l3ql4.l2

t3qt4.13 l3qr4.2 l3qL4.3

l3q2l.l

I3q2t.2 l3q2l.3l

13q21.32 13q2t.33 t3q22.t 13q22.2 13q22.3 13q3 1.1 13q31.2 13q31.3

t3q32.t

13q32.2 t3q32.3 13q33.1 13q33.2 13q33.3

DI356 Dl3SI

D13562

ESD

Dt3S22

Dl3510 RBl

D13526

D13S4r

D13S2 D13S7

D13S4 D13S5

Dr3534

13q34

coL4At cor-4/l2

D13S3

-

I

T

t

I

I r

I

:

(23)

4)La

localisation cytogénétique des marqueurs étudiés n'est pas forcément très précise.

Pour

preuve, plusieurs

locus

sont "cartographiés"

à la

même

position (Figure

1.2).

Pour certains locus, on ne connaît, d'ailleurs, que le numéro du chromosome porteur;

par exemple, le segment D14S31 est localisée entre

l4pter et l4qter, soit, en

d'autres termes, quelque part entre les deux extrémités du chromosome 14.

5)

A

relever aussi que I'identification des RFLPs s'est faite principalement _dansle but

d'isoler

des gènes responsables de maladies héréditaires

(White & ^Lalouel,

^1988),^et

ceci sur

des échantillons composés,

en

général,

de familles d'origine

européenne, comme par exemple les

familles

du

CEPH

(Centre

pour l'Etude du

Polymorphisme

Humain). Il

est possible

d'ailleurs qu'un biais

en

faveur d'une variabitité

accrue en Europe par rapport aux autres régions géographiques étudiées,

ait

ainsi

pu

être introduit dans les données

(Mountain & Cavalli

1994).

Nous

reviendrons

par la

suite

sur

ce point.

I.2.2, Protocole

de typage des

RFLPs

Læ typage

des polymorphismes de

longueur

de fragments de restriction de

locus autosomiques que nous avons entrepris s'est effectué sur

I'ADN total

extrait des lignées de lymphocytes-B transformés. Iæ matériel génomique a été obtenu

par un

protocole standard d'extraction au phénol/chloroforme à partir d'un culot de cellules (Sambrook _et

al.

1989).

Nous

avons participé, avec

B.

Kervaire,

à

I'extraction

de I'ADN qui a

été effectuée sous la direction et dans le laboratoire du

Dr. J.-M.

Tiercy, du Centre Médical Universitaire de Genève.

I-e protocole comprend: un lavage du culot cellulaire au PBS et récupération des noyaux après lyse des cellules avec le tampon de lyse

no.

1 (tampon P); un nouveau lavage au

PBS puis

récupération

de I'ADN (et

des protéines) après

lyse des noyaux

avec le tampon de lyse no.

2 (MLB:

contient SDS et Protéinase

K);

des extractions de

I'ADN

(2 au phénol et 1 au chloroforme); une digestion de

I'ARN

avec 50

pg RNAse

par

ml d'ADN

en suspension,

suivie

d'une nouvelle extraction (au phénoVchloroforme); une précipitation de

I'ADN

par

Sodium

Acétate

et

Ethanol.

Tous

les échantillons

d'ADN

ont ensuite été mis en suspension dans un tampon

Tris-EDTA.

Le test du polymorphisme des RFLPs s'est déroulé à I'Université de Stanford, dans le laboratoire de

L.

Cavalli-Sforza, selon un protocole établi

par

son équipe

et

dérivé de

(24)

ceux décrits dans Feinberg

&

Vogelstein (1983) et Feder et al. (1985). Pour assurer une meilleure conservation de

I'ADN,les

échantillons ont été complétés avæ, O.lVo d'Azide de Sodium

(10 pl

^par

ml d'ADN).

Quatre étapes caractérisent

le

protocole de typage des RFLPs:

étape no. 1: digestion des échantillons

I'ADN par

une endonucléase

Les échantillons

d'ADN

sont digérés par un enzyme de restriction selon les instructions

du

fournisseur.

En

générd,, chaque réaction contienfi

3 pg d'ADN pour 7.5

unités d'enzyme,

un

tampon de

digestion 10X, et

de

I'eau

distillée stérile.

Les

réactions de digestion se déroulent durant toute une

nuit.

_Quelques

mois

après

le

début de notre

séjour

dans

le

laboratoire

du Prof.

Cavalli-Sforza,

celui-ci s'est équipé d'un

robot

Biomek, que nous

avons

utilisé pour

préparer

un tiers, environ, des

réactions de digestion enzymatique.

étape

no.2:

éIectrophorèses sur gel d'agarose

En général, des gels à0.85Vo d'agarose

(-3 g

agarose/350

ml

de tampon

TBE lX)

ou parfois l.20%o dans un tampon de migration

TBE lX

sont utilisés. Ces gels permettent de séparer des fragments de tailles comprises entre environ 0.55 et 22

kb.

Trente-neuf puits sont préparés dans chaque gel, _lepremier

puit

recevant un marqueur de taille des fragments

(ADN

^7udigérê par

HindIII

et EcoRI). Les 38 autres puits sont chargés avec les échantillons

d'ADN

digérés.

La

séparation des fragments

d'ADN par

migration sous

I'effet d'un

^champélectrique

(35V) a lieu durant la nuit. I-e

lendemain, pour

vérifier

le résultat de la digestion enzymatique,

les

gels sont teintés avec

du

bromure

d'éthidium

(30 minutes) et photographiés sous

lumière UV; la

coloration est ensuite enlevée par rinçage des gels dans de I'eau distillée.

étape no. 3: préparation des membranes de Southern

blot

Pour séparer

I'ADN

double-brin, chaque gel est plongé, deux

fois de

suite, dans une solution de rinçage alcaline dénaturante (500

ml NaOH

4I0d,360

g

NaCl, complété à 4

litres

avec

HrO

distillée stérile),

puis

lavé

à

nouveau

à I'eau distillée. On

immerge ensuite le gel (3 fois de suite, durant 20 minutes) dans un bain neutralisant

Tris-Cl

⁽¹²⁰ ml

HCI

10N, 240 ^gTris-Base, complété à 4 litres avec HrO distillée stérile,

pH

7,5).

Ir

gel ainsi neutralisé est ensuite placé sur du papier buvard préalablement trempé dans un tampon SSPE

20X.

Une membrane de transfert est alors ^placensur le gel

(en

général

un filtre

TntaBind), recouverte encore

par du

papier buvard, et

un poids (l kg)

est

(25)

finalement placé sur I'ensemble. Iæ transfert de

I'ADN

du gel vers la membrane, par capillarité, a lieu durant la nuit. Le lendemain, pour éliminer les débris de gel et d'autres contaminants,

la

membrane est rincée dans

du

SSPE

2X, puis

une cuisson

à 90'C

durant

2

heures assure

la fixation à la

membrane

de I'ADN

transféré.

Enfin,

la membrane est lavée à

65"C

(30 minutes) avec une

solution SDS-SSPE (50 ml

SDS

10X,5 ml

SSPE 20X,

complétéàun litre

avec HrO distillée stérile), et stockée à

-20"C

dans un sac en plastique.

étape

no.4:

marquage radioactif des sondes et hybridation des membranes

Les membranes sont immergées dans une solution de pré-hybridation

(50Vo

formamide,25Vo SSPE 20X,

5Vo solution

de Denhardt 100X,

17o

SDS lo7o,

l%o

ADN

de sperme de saumon

à lOmg/ml,

ISVo

HrO

distillée stérile) à

42"C

durant une nuit précédant

I'hybridation

proprement dite. Cette opération sert à bloquer les sites de liaison de

I'ADN

non-spécifiques à la membrane; elle permet donc de diminuer

I'effet

de

"bruit

de

fond"

dans la réaction d'hybridation. I-es sondes sont

d'abord

dénaturées

(3

minutes

à 100'C),

puis incubées

(2

heures à température ambiante) avec l'enzyme

ADN

Polymérase

I

en présence des amorces spécifiques, de

3P dATP ou dcrp,

et

d'un

tampon contenant des nucléotides non radioactifs.

La

réaction de polymérisation est stoppée

par

adjonction

d'un tampon

spécifique (27o

SDS

rÙvo, 20vo

ADN

de sperme de saumon à lOmg/ml ,20Vo

EDTA

0.5

M,

58Vo

HrO

distillée stérile).

A

la

fin

de cette réaction,

une

centrifugation

à

travers

une

colonne

de

Sephadex

permet

de séparer les nucléotides non incorporés. On vérifie la quantité de nucléotides radioactifs incorporés avec

un

compteur

à

scintillation.

Les

sondes sont ensuite dénaturées une nouvelle

fois (NaOH 1.5M, 1/10 volume), et

cette

réaction est

stoppée

après l0

minutes

(HCl 1.5M, Ill0 volume). Iæs

membranes pré-hybridées

sont

transférées dans une solution

d'hybridation

(507o

formamide,

25Vo

SSPE 20X,

l%o

solution

de Denhardt 100X, ^17oSDS

lTvo,lToADN

de sperme de saumon

à

lOmg/ml

,

^22vo

HrO

distillée stérile)

à

laquelle est rajoutée

la

solution contenant

les

sondes marquées. I-a réaction d'hybridation dure 2 à 3 jours, puis les membranes sont rincées

(2

bains de 20 minutes à

42"C

dans: 50

ml

de SSPE

20X, l0 ml

de

SDS

107o, complété

à un lite

avec

Hro

distillée stérile; puis un bain de 30 minutes à

65'c

dans: 5

ml

de SSPE

20X,

10

ml

de SDS 107o, complété à un

litre

avec HrO distillée stérile) et placées sur un

film

sensible au

rayons X. Deux à trois jours au minimum sont

nécessaires

pour

une impression

lisible de la

radioactivité

sur le film. Un

deuxième

film, placé sous

la

(26)

membrane pour une impression plus longue (en général, une semaine), sert de copie de contrôle.

Une même membrane chargée de

I'ADN

^digéré^parune endonucléase spécifique peut être hybridée, plusieurs fois, à une nouvelle sonde.

A

cet effet, une fois le

film

révélé, la sonde radioactive ^estéliminée de la membrane par

un

bain de 30 minutes à 42oC dans NaOH 0.4M,

suivi d'un

bain de 30 minutes dans une solution de rinçage (SSPE

0.lM,

SDS 0.57o,

Tris 0.2M

pH 7,5). La membrane est alors stockée dans un sac en plastique à -20"C jusqu'à sa prochaine utilisation.

1.2.3 Fréquences

alléliques

des

RFLPs

L'établissement des fréquences des différents fragments observés dans

un

échantillon s'effectue

par

lecture directe

sur le film, le

système

RFLP

étant

par définition

co-

dominant. Les fragments de tailles distinctes sont

considérés

comme des

allèles différents

d'un

même polymorphisme; inversement, des fragments de même taille sont considérés comme des copies du même allèle, même si la séparation des fragments par leur taille est directement fonction de la puissance de discrimination de l'électrophorèse

(en

général,

dans notre étude, nous ne pouvions pas facilement distinguer

des différences en dessous de 50 paires de bases).

Il

^estsans doute

important

de relever, aussi, que la technique du

RFLP

ne permet pas de faire la distinction entre des copies

du même fragment, et des fragments de même taille

générés

par des

mutations différentes. Dans les deux cas, I'identité

par

ascendance est assumée.

Pour la

plupart des marqueurs que nous avons étudiés, cette supposition ^se

justifie

_{par le}

fait

que seuls

deux fragments sont observés (diallélisme); elle pourrait être moins

facilement soutenable, cependant, pour les marqueurs plurialléliques.

Pour les raisons que nous

venons

de

mentionner, l'établissement

de la taille

des fragments de restriction (en nombre de paires de bases) est imprécise, et peut conduire à des problèmes de compatibilité entre les résultats provenant de laboratoires différents.

Pour preuve, les tailles rapportées dans

GDB

varient parfois sensiblement

par

rapport aux différentes publications originales.

Afin

de tenter de

minimiser

^ce^problème,nous avons

inclus, parmi les

échantillons

d'ADN Mandenka à

analyser,

des

individus préalablement testés et provenant de différentes populations.

(27)

Dans deux cas, les marqueurs

27d (AZMIEcoRY) et 60d (GH/BgIII-II), la

détection

d'un

des fragments polymorphes était rendue

difficile par la

présence

d'un

fragment constant à la même hauteur électrophorétique. Dans ces deux cas,

ni

I'augmentation _du pourcentage

d'agarose dans le gel, ni I'augmentation du temps de

migration électrophorétique n'ont réussi a séparer le fragment polymorphe du fragment constant.

Par conséquent, la présence du fragment polymorphe aété détectée par une

plus

grande intensité

du

signal radioactif en comparaison à d'autres fragments

(voir

Figure

2

dans Poloni et al. 1995). Cette méthode de détection est cependant peu fiable:

le

signal de la sonde dépend en effet de nombreux facteurs, comme la quantité exacte

d'ADN

chargée pour chaque échantillon,

ou

le degré de digestion enzymatique etlou

d'hybridation

à la sonde atteint dans chaque échantillon.

l.2.4Echantillons

de

populations déjà

testés

pour

les

RFLPs nucléaires

Huit

échantillons de populations humaines, autres que les Mandenkalu,

ont

été testés

pour le polymorphisme

des marqueurs nucléaires dans

le

laboratoire

de L.

Cavalli- Sforza. Nous présentons ci-dessous une brève description de ces échantillons, tirée de Cavalli-Sforza

et al. (1994) et Mountain & Cavalli-Sforza (1997). Les

références originales concemant les échantillons

y

sont foumies.

A moins d'une

autre indication,

les

échantillons

d'ADN proviennent de lignées cellulaires établies à partir

de prélèvements sanguins.

L.

Cavalli-Sforza et

B.

Hewlett ont collecté

l'échantillon

de Pygmées

Bi-Aka

dans le village de Bagandu, au Sud-Ouest de la République Centrafricaine,

et l'échantillon

de Pygmées

M'buti

de la forêt de I'Inrrri dans le

Nord-Est

de la République Démocratique

du Congo (ex-Zdire). Les premiers, aussi

appelés

Pygmées

Occidentaux, seraient considérablement métissés avec des populations d'origine Nilo-Saharienne ou Bantoue, alors que les seconds, aussi appelés Pygmées Orientaux,

n'ont

vraisemblablement pas connu de métissage important.

L'échantillon d'Européens est composé d'individus d'origine

probablement nord- Européenne,

et résidant aux Etats-Unis. Pour certains marqueurs

nucléaires, les fréquences ont été complétées par des données publiées, provenant en général du typage

d'individus

du CEPH.

(28)

Les échantillons de Chinois et de Japonais sont constitués d'individus

nés, respectivement, en Chine

ou

au Japon, et résidant actuellement dans

la région de

San Francisco

(USA).

L'échantillon de

Mélanésiens, récolté

par J.

Friedlander,

est

composé

de

locuteurs Nasioi de

l'île

de Bougainville.

I-es

échantillons

de

Néo-Guinéens

et d'Aborigènes Australiens ont été donnés

au laboratoire de

L.

Cavalli-Sforza par le

Prof. A. Wilson. Ils ont

été constitués à partir d'échantillons de tissus placentaires, récoltés

en milieu

hospitalier (Cann

et al.

1987, Stoneking et

al.

1990,

Mountain &

Cavalli-Sforza 1997). L'échantillonnage des Néo- Guinéens s'est effectué aussi bien dans les régions côtières que dans les Hauts Plateaux de Papouasie Nouvelle-Guinée.

Les individus

représentés

sont

locuteurs

soit

d'une langue Austronésienne, soit d'une langue Papoue. Aucune

information

supplémentaire n' est disponible pour l'échantillon Australien.

Une étude sur la variabilité

d'un

sous-ensemble légèrement différent de

75

marqueurs nucléaires testés dans un échantillon d'un village Piémontais (Italie) a encore été publiée récemment

(Matullo

et al. 1997). Cet échantillon

a

été prélevé par le

Prof. A.

Piazza et ses collègues dans

un

village de la région Turinoise

(Matullo et

al. 1994, 1997). Tous

les individus échantillonnés sont membres d'une confrérie qui garantit qu'ils

descendent de

familles

établies dans le village au

moins

depuis le

XIIIème

siècle.

Vu

leur publication très récente, les données relatives à cet échantillon n'ont pas été incluses dans notre étude. Toutefois, nous y ferons référence à plusieurs reprises.

Par commodité, les échantillons seront parfois mentionnés, par la suite,

par

les codes suivants:

SEN

Mandenkalu du Sénégal

CAR

^Pygmées

^Bi-Aka

^dela République Centrafricaine

ZAI

^Pygmées

^M'buti

de la République Démocratique du Congo

EUR

^Européens

ITA

Piémontais d'Italie

CIN

^Chinois

JAP

^Japonais

MEL

Mélanésiens de Bougainville

NGN

Néo-Guinéens

AUS

Aborigènes Australiens

(29)

1.3.

Description

des données

1.3.1 Génotypes observés chez les

Mandenkalu

Les

génotypes

individuels

Mandenka

sont

rapportés dans

I'Annexe l. Les ADNs

individuels sont numérotés selon la liste des prélèvements établie dans notre laboratoire.

Un

ensemble de

76 individus non

directement apparentés

ont

été

choisis pour

cette étude.

Pour

chaque

polymorphisme

nucléaire à tester,

les ADNs des Mandenkalu ont

éÉ

répartis en deux gels chargés de 32 échantillons (prélèvements 103 à 305,

et prélèvements

308 à

520, respectivement) et

un gel de 12

échantillons (prélèvements 527 à558) (Annexe 1).

Durant la

première période de notre séjour dans

le

laboratoire

de L.

Cavalli-Sforza,

nous avons

systématiquement

testé les 76

prélèvements

pour chaque

marqueur nucléaire. Par la suite, nous avons décidé de réduire l'échantillon à 64

individus

(soit _les

deux grands gels de 32

échantillons),

car le typage de ces polymorphismes

_est extrêmement coûteux, autant en temps qu'en termes financiers.

D'autre part, le typage n'a pas pu été réalisé pour tous les échantillons, en raison d'une digestion enzymatique partielle

ou d'un

signal

d'hybridation de la

sonde insuffisant.

Ainsi,

un nombre variable de chromosomes a été analysé pour chaque marqueur.

Enfin, outre les 80 nucléaires rapportés dans la Table 1.1, nous avons testé sept autres marqueurs additionnels

pour

lesquels

nous n'avons pas obtenu de résultats

(les polymorphisme _derestriction de:

BsrNI

et

EcoRI

sur

IGFI, EcoRI sur

^Dl3S5

, ^BgtII

et EcoRV sur D13532 (sonde pCR1318), et les deux systèmes révélés par

MspI

sur le

locus GH), en général à cause d'une mauvaise hybridation ou même

d'une contamination de la sonde.

1.3.2 Fréquences _desallèles observés chez les

Mandenkalu

L'ensemble des fréquences alléliques observées sur les 80 marqueurs nucléaires testés dans l'échantillon Mandenka est présenté dans la Table 1.3, ainsi que dans

I'Annexe I

de Poloni et al. (1995).

(30)

Pour trois marqueurs,

cinq

allèles

qui

n'avaient pas encore été décrits ont été observés dans notre échantillon.

Il

s'agit de:

lp ^D2SLlMspI

13p ^RBI/DraI l4p DlTSTIlPvuII

2.70kb

1.35

kb

^et

3.25kb

^et ^0.80

kb 3.00 kb

L'observation

d'un

fragment supplémentaire,

à

2.7O

kb

chez les Mandenkalu nous a

conduite à

considérer

le marqueur D2SllMspI (1p) comme un

polymorphisme pluriallélique, alors

qu'il

est classé

parmi les

marqueurs dialléliques dans

les

^études

précédentes

(Bowcock et al. 1987, l99la, Lin et al.

1994).

L'observation de

deux nouveaux

fragments'pour le

marqueur

RBllDraI (l3p) n'est

pas su{prenante car le système met en évidence un polymorphisme de

type VNTR;

les fragments observés diffèrent les uns des autres par 50 paires de bases, ou par

un multiple

de ce nombre.

D'ailleurs,

le fragment à 0.80

kb

a déjà été documenté chez un

individu du CEPH

^(J.

Mountain, communication personnelle). Il se ^{peut que} ce même type

de polymorphisme caractérise le

marqueurDlTSTllPvuI[(l4p),

étant donné les variations des tailles alléliques observées (variations de 50 paires de bases ou d'un

multiple

de ce nombre). Guzetta

etal.

(1992) ont identifié

un motif ^(GAAA)re

dans

un

sous-clône de

la sonde utilisée

pour

révéler le polymorphisme

du

marqueur 14p

(pA10-41); ils

ont par ailleurs observé

un

polymorphisme _dePCR tri-allélique associé à ce

même

sous-

clône. En comparaison au marqueur 13p (RBl/DraI) le marqueur l4p

^semble,

toutefois,

bien moins

variable: seuls

les trois

échantillons

Africains

présentent des allèles supplémentaires (à des fréquences très basses) aux deux allèles communément observés (3.2 kb et 2.9 kb).

Nous avons aussi

observé

un

certain

nombre de fragments

supplémentaires pour quelques autres marqueurs. Pour ceux-ci cependant, nous n'avons pas

pu

décider

s'il

s'agissait

réellement

de nouveaux

allèles

ou d'artefacts

causés

par une

digestion enzymatique partielle etlou une mauvaise migration électrophorétique: nous avons donc choisi de les ignorer.

Polymorphismes de l&#039;ADN et histoire du peuplement humain: apports de l&#039;étude des marqueurs RFLP

Thesis

Reference