s'ensuit que très peu d'échantillons comparables peuvent être rassemblés et analysés
globalement, comme cela
a
étêle
cas dans d'autres systèmesà
l'échelle mondiale (Sanchez-Mazas, 1986; Sanchez-Mazas and I-anganey, 1988) ou continentale (Excoffieret al., 7987 ; Sanchez-Mazas, 1988).
LIMITES D'INTERPRÉTATION
Dans cette étude,
il
ne nous sera donc pas possible de dresser des rapports exacts entre les populations humaines à partir des seules données d'un certain type de polymorphisme moléculaire (séquences, PLFR),w le
nombrelimité
des populations étudiées, mais nous pourrons néanmoins préciser comment quelques groupes de populations se sont différenciées du point de vue moléculaire.Il
sera ensuite intéressant de confronter les résultats d'analyses de PLFR entre eux et à ceux obtenus pour d'autres systèmes génétiques afin d'examiner dans quelle mesure ils sont compatibles.Une incompatibilité pourrait bien évidemment surgir si certaines conditions générales citées plus haut n'étaient pas vérifiées. Or, les difficultés sont potentiellement nombreuses dans
le
casde I'ADN-mt où
nous avons déjàw
que les tailles deséchantillons étaient
très
réduites.De
plus,l'ADN-mt, du fait de
sa transmission maternelle, peut conduireà un
schémade
différenciation des populationsqui
soit différent de celui d'un système génétique codé au niveau du noyau (Poulton, 1987).Enfin, au cas où certains des allèles de I'ADN-mt seraient sélectionnés (Johnson et aI., 1983; Whittam
et al.,
1986), les différences observées pourraientêtre
duesà
une hétérogénéité des conditions de sélection plutôt qu'à un processus évolutif neutre.L'avantage des systèmes génétiques moléculaires réside avant tout dans la précision
de la
définition des haplotypeset
dansla
connaissance des événements moléculaires possibles ayant conduit à leur différenciation. Ce gain d'information par rapportà
des systèmes génétiques classiques (groupes sanguins, tissulairesou
deprotéines) esl quelque peu balancé par la nécessité de collecter des échantillons plus grands. Un équilibre doit être trouvé entre ces deux qualités aujourd'hui antagonistes, mais
qui
pourrontet
dewontêtre
alliéesà
I'avenir. Dansle
cas contraire,si
les techniques de séquençage étaient appliquéesà
grande échelle sans se soucier de la qualité de l'échantillonnage, nous serions confrontésà
des collections de gènes tous différentsentre eux et
entrerions dansle
domainede
l'étudede la
variabilité interindividuelle qui n'a pas de fondement en génétique des populations. Ceci n'aurait guère plus d'intérêt que I'autre cas extrêmequi
consisteraità
étudierde
grandséchantillons pour un seul site de restriction et qui classerait toute I'espèce humaine en deux catégories.
DONNÉES zROVENANT DU SÉQUnNÇIGE DE L'ADN MITOCHONDRAL
L3analyse des séquences d'ADN-mt provenant d'individus non apparentés a
porté, nous I'avons vu, sur de petits échantillons et n'entre donc pas dans le cadre de
l'étude des populations (au sens biologique du terme). Néanmoins, ces travaux ont permis de mieux connaître
la
structureet la
nature des variations moléculaires deI'ADN-mt. Ces précisions nous seront utiles pour mieux cerner certains problèmes d'interprétation des données portant sur les PLFR.
VARIABILITÉ DE LA PORTION NON CODANTE DE L'ADN-MT
Les travaux de Greenberget al. (1983) et d'Aquadro et Greenberg (1983) ont
porté sur une
même région, principalementnon
codante,de I'ADN-mt
(D-I-oop) (Figure 3.1). Cette région comprendle
lieu de I'initiation dela
réplication et de la transcription d'un des deux brins d'ADN. Au niveau interspécifique, elle semble être la portion la moins bien conservée de I'ADN-mt (Anderson et a1.,1981; Upholt and Dawid, 1977; Walberg and Clayton, 1981).I-a
comparaison des séquences provenant de 7individus différents et d'une longueur de 899 pb ont permis de préciser plusieurs points importants.
Tout d'abord, Greenberget al. (1983) ont montré que cette région n'était pas
homogène
du point de
vuedu
tauxde
substitution des nucléotides. Deux régions hypervariablesont été
misesen
évidence aux extrémitésde la
D-Loop. Celles-ci s'étendent approximativement des nucléotides 146à
263et
des nucléotides 76724 à16362 selon la nomenclature d'Anderson et al. (1981) que nous utiliserons tout au long de ce travail. I-e taux de substitution moyen entre individus a été calculé selon plusieurs procédures (voir plus
loin
pour leur développement)qui
conduisentà
des résultats légèrement différents, mais qui montrent toutes que ce taux est considérablement plus êlevê que celui qui avait été estimé sur la base d'études menées avec des enrymes derestriction sur l'ensemble du génome mitochondrial. Ainsi, Brown (1980) etFenis et al.
(1981) estiment celui-ci
à
respectivement 0,36Voet
0,30Vo, alorsqu'
Aquadro et Greenberg (1983) trouvent un chiffre 5,5 fois plus élevés (1,8%o) (voir Table 3.3) pourcette région non codante.
Il
faut toutefois noter que les régions hypervariables sont presque seules responsables de cet écart (Greenberget a1.,1983).DÉtÉnoNs ar TNIERTTINS
Sur les 7 séquences, 56 sites de mutations ont été observés. Parmi ceux'ci, 5
mutations de longueur ont été dêtectées (délétions ou insertions). Elles se présentent généralement à l'intérieur de répétitions de mono ou dinucléotides et concernent L ou 2 bases seulement. De tels polymorphismes de longueur sont peu probables dans le reste du génome mitochondrial du fait de son extrême compactage et de sa nature codante.
Le
déplacement d'uneou
deux positions du cadre de lecture conduirait en effet àl'élaboration de protéines non fonctionnelles.
Narunn DES suBsrITwroNS
I-es autres mutations sont dues à des substitutions de nucléotides (Figure 3.2).De façon surprenante,lagrande majorité des substitutions observées est composée de transitions (49/51 ou 96,lVo) (voir Tables 3.L et 3.4). Si la substitution d'une base
pour une autre était équiprobable, on s'attendrait
à un
taux de L transition pour 2 transversions (Figure 3.2).Au
niveau interspécifique, Brown etal.
(1982) ont montré quece
degréde
biais transitionnel êtait corrélé négativement avecle
temps de divergence endre espèces d'hominiens. Iæs transitions représentent encore plus de 90%des substitutions apparentes dans
la
comparaison de séquences d'ADN-mt entre des hominiens ayant divergé récemment (environ 5 millions d'années) (Brown et al., l9S2).On constate néanmoins que plus le temps de divergence entre espèce augmente, plus le taux de transversions est important par rapport aux transitions. Les travaux d'Aquadro er
al.
(L98\
ont confirmé I'hypothèse selon laquelle cette augmentation serait uniquement due au biais transitionnel.Il
semble donc bien qu'ily ait une accumulation préférentielle de transitions dans la région de contrôle de l'ADN-mt à un taux environ 25 fois plus important que les transversions. Deux transitions sur un même site passeront inaperçues alors que les quelques transversions qui se produisent seront visibles, même si elles subissent encore d'autres transitions.A
long terme, ce phénomène peut expliquer labaisse du taux total de substitutions après 15 millions d'années de divergence, observée
par
Brownet al.
(1979), mais interprétée alors commeune
saturation des sites connaissant un taux de substitution élevé.Ox
ARN-tv.r ARN-tPh.
ARNTS
D-loop fiflfil-lrrt
-.â-J---t
réglon étudiéel
FIGURE 3.1 : Région de la molécule d'ADN-mt étudiée par Greenberg et al. (1953) et par Aquadro et Greenberg (1983). L'ARN de coefficient de sédimentation 7 S ne doit pas être confondu avec I'ADN 7 S qui est une ancienne appellation erronée du brin d'ADN de 570-655 pb, complémentaire du brin léger, synthétisé pour former la stîucture triplex D-Loop (Clayton, 1982).
ARN-r 125
\zg
\rz
T21
)rzt )rsr
\rs
\sz
Xrz
\rs
Àst
\cr
\rq
FIGURE 3.2 : Substitutions entre nucléotides. Les flèches en gras indiquent des transitions
TABLE 3.1
:
Origine des substitutions de nucléotides observées entre7
séquences de la région de contrÔle (d'après Aquadro et Greenberg (1983).Type de substitutions
Nombre observé
Transitions
A.+G GTA T+C c+T
Transversiotts
l3
20 9 7
33
l6
49
A+T T+A
C*G
G-+CC*A A+C T*G G*T
0 0 0 I 0 0 I 0
2
La Table 3.1. nous montre également que la majorité des transitions (33/a9) provient des passagêS
A
<+ G. Ces substitution non aléatoires ont pour conséquence de fausser considérablement les estimations du taux de substitution du fait de I'occurrence de mutations parallèles et réverses.S ussrrrviloN s M IJLmPLE s
Aquadro et Greenberg (1983) ont construit un réseau phylogénique entre les Z séquences'étudiées (voir plus loin, pour la discussion de la validité des réseaux ou arbres phylogéniques) sur la base de 10 sites de substitution "informatifs". Notons qu'une mutation est dite "informative", pour une construction phylogénique, si elle est présente sur plus d'une séquence (Fitch, 7977). Dans le cas inverse, la mutation a pu se produire