• Aucun résultat trouvé

Les différents marqueurs génétiques et leur

caractéristiques

La génétique : l'étude du polymorphisme de l'ADN

L'ADN, acide désoxyribonucléique, est une biomolécule présente, chez les eucaryotes, dans le noyau de la cellule et dans les mitochondries, sous la forme de chromosomes. Elle porte les informations nécessaires au fonctionnement des cellules et des organismes, sous la forme de séquences de nucléotides. Elle est le support de l'hérédité puisque ces informations sont transmises lors de la reproduction.

La réplication de l'ADN ne produit pas toujours une copie identique, des évènements de mutations peuvent se produire et amener l’apparition d’un polymorphisme, c'est à dire la présence de molécules d'ADN non identiques, entre les cellules. Plusieurs types de mutations peuvent se produire : des substitutions, c'est à dire le changement d'un nucléotide en un autre, des insertions d'un ou plusieurs nucléotides, des délétions d'un ou plusieurs nucléotides, ou encore des déplacements de fragments d'ADN de grande taille, lors de crossing-over asymétriques ou de transferts de gène. Si ces mutations se produisent sur des cellules germinales, elles pourront être transmises à la descendance et ce polymorphisme sera alors retrouvé entre les individus. Les mutations produisent donc une variabilité génétique entre les individus, les populations et les espèces.

La génétique étudie ce polymorphisme pour en tirer des informations à l'aide de marqueurs génétiques. Un marqueur génétique peut être défini comme une portion de l'ADN, de petite taille, facilement identifiable et analysable et présentant un polymorphisme. Il existe plusieurs types de marqueurs génétiques.

Les marqueurs nucléaires

Les marqueurs nucléaires sont, par définition, situés sur l’ADN chromosomique localisé dans le noyau des cellules eucaryotes. Une des particularités de l’ADN nucléaire des eucaryotes est que les chromosomes sont organisés par paires homologues sauf pour les chromosomes sexuels qui peuvent être différents. Chaque portion de l’ADN, codant ou non codant, est présente sur deux chromosomes. Pour un locus donné, chaque individu pourra donc présenter soit deux copies identiques (on parle alors d’individu homozygote pour le locus considéré), soit deux copies différentes (individu hétérozygote).

44 Le polymorphisme génétique peut être étudié de différentes façons. D'abord par empreintes génétiques ("DNA fingerprint") soit à l'aide de sondes radioactives (technique du Southern blot par exemple) soit suite à une amplification par PCR : amplification aléatoire d’ADN polymorphes ou RAPD ("Random Amplified Polymorphism DNA"), polymorphisme de longueur de fragment amplifié ou AFLP ("Amplified Fragment Length Polymorphism") (Féral 2002 ; Arif et al. 2011) ou amplification de séquences inter-microsatellitaires, appelé aussi ISSR (Jung 1998). Ces trois marqueurs sont des marqueurs dominants et anonymes car basés sur un système de présence/absence de fragments sans (ou avec très peu de) connaissance nécessaire sur la nature de ces fragments. Ils permettent d’estimer des génotypes mais pas de calculer des fréquences alléliques et ils sont suffisamment variables pour pouvoir travailler à l’échelle de l’individu (Féral 2002). Chez les mammifères marins ils ont été utilisés, par exemple, pour déterminer des individus hybrides entre marsouins communs et marsouins de Dall (Willis et al. 2004) ou comparer des polymorphismes entre dauphins communs et marsouins communs (Hassani et al. 2008). Ces marqueurs permettent aussi l'analyse de plusieurs loci à la fois.

D'autres marqueurs ciblent une seule région de l'ADN à la fois. Ce sont souvent des marqueurs codominants et ciblés. Un de ces marqueurs les plus utilisés est le marqueur microsatellite ou SSR (Simple Sequence Repeat). Les microsatellites sont des portions d’ADN, présentes chez tous les eucaryotes (Tautz & Renz 1984), et ils sont formés par la répétition d’un motif simple, composé généralement de 1 à 5 nucléotides (GATA est un motif tetranucléotidique par exemple). Ce motif peut être répété jusqu'à 100 fois en un même locus (Arif et al. 2011). Litt et Luty ont constaté pour la première fois que les microsatellites présentaient une forte variabilité (Litt & Luty 1989). Cette variabilité provient d’un taux relativement haut de mutation pouvant provenir d’erreurs de réplications ou de crossing-over non symétriques. Les mutations qui se produisent alors sont des ajouts ou des suppressions d'un ou plusieurs motifs. Les microsatellites sont des hot-spot de mutation, c'est à dire des zones de l'ADN hyper variables et donc très polymorphes (Féral 2002).

Pour étudier un site contenant un microsatellite précis, on détermine le nombre de répétitions du motif en amplifiant un fragment d'ADN contenant le microsatellite. La taille du fragment amplifié permettra de déterminer le nombre de répétitions du motif. Ce marqueur présente de nombreux avantages (Bourret et al. 2008) :

• il est un des plus variables disponible actuellement et permet de détecter des structures génétiques même très faibles au sein de populations

• il est codominant, ce qui permet de calculer des fréquences alléliques • il est techniquement relativement facile à utiliser

• grâce à la PCR, il peut être analysé même à partir d’ADN dégradé et/ou en faible quantité (par exemple sur de l’ADN extrait de fèces de dauphin (Parsons 2001))

45 Le principal défaut des marqueurs microsatellites est la nécessité de connaître ses séquences flanquantes afin de pouvoir définir les amorces de PCR (Bourret et al. 2008).

Les marqueurs mitochondriaux

La mitochondrie est un organite cellulaire essentiel à la vie car elle participe à la transformation de l’énergie contenue dans les sucres et les graisses en ATP (Adénosine TriPhosphate) qui sera la source d’énergie chimique principale de la cellule (Ballard & Whitlock 2004). Chaque cellule eucaryote peut contenir de nombreuses mitochondries qui contiennent plusieurs copies de leur chromosome. Le chromosome mitochondrial chez les mammifères est un ADN double brin circulaire de taille comprise entre 15 000 et 17 000 paires de bases. Trente-sept gènes codant pour des molécules spécifiques de la mitochondrie sont présents : 2 gènes sont transcrits sous forme d’ARN ribosomique, 22 sous forme d’ARN de transfert et 13 gènes codent pour des sous-unités de protéines de la chaîne respiratoire. Il existe une partie non codante de grande taille, la région de contrôle mitochondriale, ayant un rôle dans la réplication. Sauf exception il n’existe pas de recombinaison de l’ADN mitochondrial chez les animaux. L’ADN mitochondrial est haploïde et sa transmission est uniquement maternelle, ce qui diminue la taille efficace de l’ADN mitochondrial (Ballard & Whitlock 2004). Le taux de mutation de l’ADNmt est généralement fort, Brown et al. (1979) ont, par exemple, estimé à 2% tous les millions d’années le taux de mutations chez les primates supérieurs (Brown et al. 1979). Cependant ce taux diffère entre les différentes parties de l’ADN mitochondrial. Il a été montré que chez les mammifères, la région de contrôle était la plus divergente, notamment sa partie 5’, et que la partie codant pour l’ARN ribosomale était la plus conservée (Lopez et al. 1997).

Bien que l’ADN mitochondrial soit haploïde, la présence de chromosomes différents au sein d'une même cellule est possible, on parle alors d’hétéroplasmie (Vollmer et al. 2011). L’hétéroplasmie peut provenir de mutations ayant eu lieu sur une partie seulement des chromosomes mitochondriaux présents, de recombinaison ou de provenance multiples des mitochondries (apport paternel ou double apport maternel). Il existe des hétéroplasmies de sites, avec une substitution, ou de taille, avec la présence d’une insertion ou d’une délétion. Bien que les cas d’hétéroplasmies soient peu fréquents dans le règne animal, il en existe chez les mammifères marins et la proportion de leur présence varie en fonction de l’espèce. Chez les cétacés, la région de contrôle est plus sujette à l’hétéroplasmie que les parties codantes (Vollmer et al. 2011).

Les marqueurs mitochondriaux sont des séquences de l’ADN mitochondrial présentant un polymorphisme. Ils peuvent être issus de partie codante ou non codante. Ils ont été très utilisés, ces trente dernières années, comme outil, pour inférer les histoires évolutives et démographiques des espèces et des populations (Ballard & Whitlock 2004). Plusieurs des caractéristiques inhérentes à l'ADN mitochondrial sont à prendre en compte car elles peuvent entraîner des biais dans les analyses de génétique (Ballard & Whitlock 2004).

46 • L’absence de recombinaison implique que le chromosome mitochondrial doit être considéré comme une seule entité, et que, donc, ses différentes portions ne peuvent pas être considérées comme des marqueurs différents, mais simplement comme plusieurs parties du même marqueur.

• Une partie de l’ADN mitochondrial étant codant, l’ensemble du marqueur est soumis à la sélection. Cette sélection peut être forte car l’ADN mitochondrial code pour des protéines nécessaires à la chaîne respiratoire qui est essentielle à la cellule.

• Il existe des introgressions possibles au niveau de l’ADN mitochondrial qui peuvent perturber des analyses phylogénétiques comparant plusieurs marqueurs. L'introgression est un transfert d'une portion d'ADN entre deux organismes d'espèces différentes, suite à une hybridation ponctuelle.

• Enfin le mode de transmission uniquement maternel implique que les études portant sur l’ADN mitochondrial seul ne permettront pas une compréhension totale de l’histoire génétique.

Les marqueurs mitochondriaux peuvent être analysés de différentes façons. Historiquement, la première méthode d'analyse a fait appel à l’utilisation de polymorphisme de longueur de fragments de restriction ou RFLP ("Restriction Fragment Length Polymorphism"). Chez les mammifères marins, Wang et al. (1996), par exemple, ont utilisé cette approche pour étudier les marsouins communs en Amérique du Nord, et ils ont détecté ainsi des différentiations génétiques entre Atlantique et Pacifique (Wang et al. 1996). La deuxième méthode d'analyse, et la plus utilisée actuellement, consiste à comparer des séquences de portions d'ADN mitochondrial d'intérêt. Ces séquences peuvent correspondre à des parties codantes (cytochrome oxydase, cytochrome b…) ou non codante (région de contrôle mitochondriale) du génome mitochondrial, en fonction de l’échelle à laquelle se place l’étude, les parties non codantes étant beaucoup plus polymorphes (Arif et al. 2011). Les séquences de parties codantes peuvent typiquement être utilisées pour étudier la phylogénie (LeDuc et al. 1999), pour comparer des diversités génétiques intra et interspécifique (Viricel & Rosel 2012) ou pour identifier des espèces (voir chapitre 1). Les séquences de la région de contrôle mitochondriale sont principalement utilisées dans les études de génétique des populations (par exemple : Dalebout et al. 2005; Tolley & Rosel 2006) et peuvent servir à définir ou à confirmer des unités de gestions (Chivers et al. 2007).

Comparaison des marqueurs nucléaires et mitochondriaux

Il existe plusieurs différences entre les marqueurs nucléaires et mitochondriaux qui s’expliquent par les biologies différentes de ces deux génomes :

47 • La taille du génome est très différente, le génome mitochondrial étant 10 000 fois plus

petit (Ballard & Whitlock 2004).

• Le nombre de copies présentes par cellule est très important pour l’ADN mitochondrial, plusieurs centaines de milliers alors que l’ADN nucléaire est présent lui une seule fois par cellule, au sein du noyau (Montier et al. 2009). Le nombre important de copies de l’ADN mitochondriale est un avantage lors de travaux menés sur de l’ADN en petite quantité, dégradé, fragmenté ou ancien.

• L’ADN mitochondrial est haploïde alors que l’ADN nucléaire est diploïde (sous la forme de paires de chromosomes homologues), ce qui fait que chaque loci sera présent deux fois et rend possible l’hétérozygotie (Ballard & Whitlock 2004).

• L’ADN mitochondrial est transmis uniquement par la mère ce qui empêche le mélange, contrairement à l’ADN nucléaire qui est brassé à chaque génération, et explique le fait que l’étude de l’ADN mitochondrial n’apporte des informations que sur la lignée maternelle de l’individu (Ballard & Whitlock 2004).

• La dérive génétique de l’ADN mitochondrial est 4 fois supérieure à celle de l’ADN nucléaire parce que l’ADN mitochondrial est haploïde et que la transmission est uniquement maternelle. Ceci entraîne une fixation des allèles plus rapide (Ballard & Whitlock 2004).

• Le taux de mutation est nettement supérieur pour l’ADNmt que pour l’ADN nucléaire, entre 5 à 10 fois chez les primates supérieurs (Brown et al. 1979).

• Le crossing over permet une recombinaison au sein d’un chromosome nucléaire et un brassage entre paires homologues, alors qu’il n’existe pas de recombinaison pour le chromosome mitochondrial. Les portions de l’ADN mitochondrial ne peuvent donc pas être considérées comme des marqueurs indépendants (Ballard & Whitlock 2004).

Les marqueurs mitochondriaux et nucléaires présentent beaucoup de qualités différentes qui se complètent. L’ADN mitochondrial, par sa taille efficace plus faible et son taux de mutation supérieur, est un marqueur puissant pour les études de biodiversité génétique. Cependant par son absence de recombinaison et sa transmission uniquement maternelle, il ne permet pas de diversifier les loci. L’ADN nucléaire, lui, permet d’étudier de nombreux loci facilement mais sa dérive génétique sera plus faible et la fixation des allèles moins rapide. C’est pour cela qu’il est conseillé de diversifier les marqueurs utilisés et de mélanger les loci mitochondriaux et nucléaires dans les études de biodiversité génétique (Ballard & Whitlock 2004 ; Arif et al. 2011).

Les études mélangeant les marqueurs peuvent obtenir des résultats différents voir contradictoires entre les marqueurs nucléaires et mitochondriaux. Cela peut venir d’une hybridation en cours, d’asymétries liées au sexe ou d’introgressions de l’ADN mitochondrial (Toews & Brelsford 2012). Certains marqueurs sont aussi choisis pour donner des informations différentes, ainsi l’ADN mitochondrial nous apporte des informations sur la lignée maternelle. Rosel et al., ont par exemple utilisé cette caractéristique pour montrer une

48 phylopatrie plus importante des femelles chez le marsouin commun (Rosel, France, et al. 1999a). Les marqueurs génétiques issus du chromosome Y apportent, eux, des informations spécifiquement sur la lignée paternelle. La combinaison des deux marqueurs est très utilisée pour identifier des hybrides et les espèces respectives des parents. Par exemple Vila et al., ont pu identifier un hybride chien/loup et l’espèce de ses parents, grâce à la combinaison de ces marqueurs (Vilà et al. 2003).

L'étude des polymorphismes de l'ADN est un outil pour