• Aucun résultat trouvé

rarement représentatives d'un groupe plus important ou même d'un ensemble continental. L étude du polymorphisme de I'ADN humain venant à peine de débuter, il

s'ensuit que très peu d'échantillons comparables peuvent être rassemblés et analysés

globalement, comme cela

a

étê

le

cas dans d'autres systèmes

à

l'échelle mondiale (Sanchez-Mazas, 1986; Sanchez-Mazas and I-anganey, 1988) ou continentale (Excoffier

et al., 7987 ; Sanchez-Mazas, 1988).

LIMITES D'INTERPRÉTATION

Dans cette étude,

il

ne nous sera donc pas possible de dresser des rapports exacts entre les populations humaines à partir des seules données d'un certain type de polymorphisme moléculaire (séquences, PLFR),

w le

nombre

limité

des populations étudiées, mais nous pourrons néanmoins préciser comment quelques groupes de populations se sont différenciées du point de vue moléculaire.

Il

sera ensuite intéressant de confronter les résultats d'analyses de PLFR entre eux et à ceux obtenus pour d'autres systèmes génétiques afin d'examiner dans quelle mesure ils sont compatibles.

Une incompatibilité pourrait bien évidemment surgir si certaines conditions générales citées plus haut n'étaient pas vérifiées. Or, les difficultés sont potentiellement nombreuses dans

le

cas

de I'ADN-mt où

nous avons déjà

w

que les tailles des

échantillons étaient

très

réduites.

De

plus,

l'ADN-mt, du fait de

sa transmission maternelle, peut conduire

à un

schéma

de

différenciation des populations

qui

soit différent de celui d'un système génétique codé au niveau du noyau (Poulton, 1987).

Enfin, au cas où certains des allèles de I'ADN-mt seraient sélectionnés (Johnson et aI., 1983; Whittam

et al.,

1986), les différences observées pourraient

être

dues

à

une hétérogénéité des conditions de sélection plutôt qu'à un processus évolutif neutre.

L'avantage des systèmes génétiques moléculaires réside avant tout dans la précision

de la

définition des haplotypes

et

dans

la

connaissance des événements moléculaires possibles ayant conduit à leur différenciation. Ce gain d'information par rapport

à

des systèmes génétiques classiques (groupes sanguins, tissulaires

ou

de

protéines) esl quelque peu balancé par la nécessité de collecter des échantillons plus grands. Un équilibre doit être trouvé entre ces deux qualités aujourd'hui antagonistes, mais

qui

pourront

et

dewont

être

alliées

à

I'avenir. Dans

le

cas contraire,

si

les techniques de séquençage étaient appliquées

à

grande échelle sans se soucier de la qualité de l'échantillonnage, nous serions confrontés

à

des collections de gènes tous différents

entre eux et

entrerions dans

le

domaine

de

l'étude

de la

variabilité interindividuelle qui n'a pas de fondement en génétique des populations. Ceci n'aurait guère plus d'intérêt que I'autre cas extrême

qui

consisterait

à

étudier

de

grands

échantillons pour un seul site de restriction et qui classerait toute I'espèce humaine en deux catégories.

DONNÉES zROVENANT DU SÉQUnNÇIGE DE L'ADN MITOCHONDRAL

L3analyse des séquences d'ADN-mt provenant d'individus non apparentés a

porté, nous I'avons vu, sur de petits échantillons et n'entre donc pas dans le cadre de

l'étude des populations (au sens biologique du terme). Néanmoins, ces travaux ont permis de mieux connaître

la

structure

et la

nature des variations moléculaires de

I'ADN-mt. Ces précisions nous seront utiles pour mieux cerner certains problèmes d'interprétation des données portant sur les PLFR.

VARIABILITÉ DE LA PORTION NON CODANTE DE L'ADN-MT

Les travaux de Greenberget al. (1983) et d'Aquadro et Greenberg (1983) ont

porté sur une

même région, principalement

non

codante,

de I'ADN-mt

(D-I-oop) (Figure 3.1). Cette région comprend

le

lieu de I'initiation de

la

réplication et de la transcription d'un des deux brins d'ADN. Au niveau interspécifique, elle semble être la portion la moins bien conservée de I'ADN-mt (Anderson et a1.,1981; Upholt and Dawid, 1977; Walberg and Clayton, 1981).

I-a

comparaison des séquences provenant de 7

individus différents et d'une longueur de 899 pb ont permis de préciser plusieurs points importants.

Tout d'abord, Greenberget al. (1983) ont montré que cette région n'était pas

homogène

du point de

vue

du

taux

de

substitution des nucléotides. Deux régions hypervariables

ont été

mises

en

évidence aux extrémités

de la

D-Loop. Celles-ci s'étendent approximativement des nucléotides 146

à

263

et

des nucléotides 76724 à

16362 selon la nomenclature d'Anderson et al. (1981) que nous utiliserons tout au long de ce travail. I-e taux de substitution moyen entre individus a été calculé selon plusieurs procédures (voir plus

loin

pour leur développement)

qui

conduisent

à

des résultats légèrement différents, mais qui montrent toutes que ce taux est considérablement plus êlevê que celui qui avait été estimé sur la base d'études menées avec des enrymes de

restriction sur l'ensemble du génome mitochondrial. Ainsi, Brown (1980) etFenis et al.

(1981) estiment celui-ci

à

respectivement 0,36Vo

et

0,30Vo, alors

qu'

Aquadro et Greenberg (1983) trouvent un chiffre 5,5 fois plus élevés (1,8%o) (voir Table 3.3) pour

cette région non codante.

Il

faut toutefois noter que les régions hypervariables sont presque seules responsables de cet écart (Greenberget a1.,1983).

DÉtÉnoNs ar TNIERTTINS

Sur les 7 séquences, 56 sites de mutations ont été observés. Parmi ceux'ci, 5

mutations de longueur ont été dêtectées (délétions ou insertions). Elles se présentent généralement à l'intérieur de répétitions de mono ou dinucléotides et concernent L ou 2 bases seulement. De tels polymorphismes de longueur sont peu probables dans le reste du génome mitochondrial du fait de son extrême compactage et de sa nature codante.

Le

déplacement d'une

ou

deux positions du cadre de lecture conduirait en effet à

l'élaboration de protéines non fonctionnelles.

Narunn DES suBsrITwroNS

I-es autres mutations sont dues à des substitutions de nucléotides (Figure 3.2).De façon surprenante,lagrande majorité des substitutions observées est composée de transitions (49/51 ou 96,lVo) (voir Tables 3.L et 3.4). Si la substitution d'une base

pour une autre était équiprobable, on s'attendrait

à un

taux de L transition pour 2 transversions (Figure 3.2).

Au

niveau interspécifique, Brown et

al.

(1982) ont montré que

ce

degré

de

biais transitionnel êtait corrélé négativement avec

le

temps de divergence endre espèces d'hominiens. Iæs transitions représentent encore plus de 90%

des substitutions apparentes dans

la

comparaison de séquences d'ADN-mt entre des hominiens ayant divergé récemment (environ 5 millions d'années) (Brown et al., l9S2).

On constate néanmoins que plus le temps de divergence entre espèce augmente, plus le taux de transversions est important par rapport aux transitions. Les travaux d'Aquadro er

al.

(L98\

ont confirmé I'hypothèse selon laquelle cette augmentation serait uniquement due au biais transitionnel.

Il

semble donc bien qu'ily ait une accumulation préférentielle de transitions dans la région de contrôle de l'ADN-mt à un taux environ 25 fois plus important que les transversions. Deux transitions sur un même site passeront inaperçues alors que les quelques transversions qui se produisent seront visibles, même si elles subissent encore d'autres transitions.

A

long terme, ce phénomène peut expliquer la

baisse du taux total de substitutions après 15 millions d'années de divergence, observée

par

Brown

et al.

(1979), mais interprétée alors comme

une

saturation des sites connaissant un taux de substitution élevé.

Ox

ARN-tv.r ARN-tPh.

ARNTS

D-loop fiflfil-lrrt

-.â-J---t

réglon étudiéel

FIGURE 3.1 : Région de la molécule d'ADN-mt étudiée par Greenberg et al. (1953) et par Aquadro et Greenberg (1983). L'ARN de coefficient de sédimentation 7 S ne doit pas être confondu avec I'ADN 7 S qui est une ancienne appellation erronée du brin d'ADN de 570-655 pb, complémentaire du brin léger, synthétisé pour former la stîucture triplex D-Loop (Clayton, 1982).

ARN-r 125

\zg

\rz

T21

)rzt )rsr

\rs

\sz

Xrz

\rs

Àst

\cr

\rq

FIGURE 3.2 : Substitutions entre nucléotides. Les flèches en gras indiquent des transitions

TABLE 3.1

:

Origine des substitutions de nucléotides observées entre

7

séquences de la région de contrÔle (d'après Aquadro et Greenberg (1983).

Type de substitutions

Nombre observé

Transitions

A.+G GTA T+C c+T

Transversiotts

l3

20 9 7

33

l6

49

A+T T+A

C*G

G-+C

C*A A+C T*G G*T

0 0 0 I 0 0 I 0

2

La Table 3.1. nous montre également que la majorité des transitions (33/a9) provient des passagêS

A

<+ G. Ces substitution non aléatoires ont pour conséquence de fausser considérablement les estimations du taux de substitution du fait de I'occurrence de mutations parallèles et réverses.

S ussrrrviloN s M IJLmPLE s

Aquadro et Greenberg (1983) ont construit un réseau phylogénique entre les Z séquences'étudiées (voir plus loin, pour la discussion de la validité des réseaux ou arbres phylogéniques) sur la base de 10 sites de substitution "informatifs". Notons qu'une mutation est dite "informative", pour une construction phylogénique, si elle est présente sur plus d'une séquence (Fitch, 7977). Dans le cas inverse, la mutation a pu se produire

n'importe quand

dans

le

processus

évolutif, et

n'apporte,

par

conséquent, pas