• Aucun résultat trouvé

De la paléogénétique à la paléogénomique

Dans le document The DART-Europe E-theses Portal (Page 55-60)

2.3. Les méthodes de l’ADN ancien

2.3.2. Les séquences d’ADN ciblées

2.3.2.3. De la paléogénétique à la paléogénomique

En 2005, la première étude visant à caractériser de larges portions du génome nucléaire est publiée (Noonan et al., 2005). Deux échantillons d’ours des cavernes, âgés d’environ 40 000 ans environ ont été choisis pour construire des banques d’ADN, sans amplification ni sélection a priori des fragments. Près de 15 000 clones, appartenant aux deux librairies, ont ensuite été séquencés par la méthode de séquençage Sanger, ce qui a permis d’obtenir 26 800 pb du génome nucléaire d’ours des cavernes.

Cette première analyse a montré que la proportion d’ADN endogène était très faible par rapport aux ADN contaminants, car seules 1,1 et 5,5 % des lectures des deux banques s’alignaient avec les séquences de Carnivores.

Une analyse similaire, menée sur une librairie d’extrait d’os de Néanderthal (Figure 16), a permis de retrouver près de 55 000 pb de son génome nucléaire (Noonan et al., 2006).

Figure 16 : Séquençage métagénomique de librairies d’ADN ancien, par une méthode traditionnelle (d’après (Noonan et al., 2006)).

L’analyse de paléogénomes a beaucoup bénéficié des nouvelles technologies de séquençages, développées depuis 2005 par Roche Applied Science (454 Genome Sequencer FLX Instrument), Illumina (Solexa Genome Analyzer), Applied Biosystems (ABI SOLiD system) et Helicos Bioscience (HeliScope). Comme les deux premiers font partie de ceux qui sont les plus couramment utilisés en paléogénomique, nous les présentons plus en détail ci-dessous.

2.3.2.3.1. La méthode de séquençage à haut débit 454

La première de ces technologies (Margulies et al., 2005) consiste à ligaturer des fragments d’ADN de petite taille à des adaptateurs spécifiques (Figure 17). Les fragments sont ensuite attachés à des billes de streptavidine sur lesquelles des amorces complémentaires de l’un des adaptateurs sont fixées. En moyenne, chaque bille ne porte qu’un fragment. Les fragments sont ensuite amplifiés par une PCR à émulsion, qui permet de couvrir la bille de millions de produits de PCR.

Les billes sont ensuite déposées sur une puce dans laquelle des puits ont été creusés, de façon à ce que chaque puit ne contienne qu’une bille. Chaque puit est relié à une fibre optique qui conduit les informations lumineuses émises dans ce puit jusqu’à une caméra CCD. Les fragments sont ensuite séquencés par pyroséquençage.

Figure 17 : Principe de la méthode de séquençage à haut-débit 454.

Cette méthode permet de séquencer un million de fragments d’ADN en parallèle, sur une longueur de 400 pb. Au total, un milliard de nucléotides peuvent être séquencés en une journée.

2.3.2.3.2. La méthode de séquençage à haut-débit Solexa

La deuxième méthode de séquençage de nouvelle génération a été développée par la société Solexa, rachetée depuis par Illumina (Bentley et al., 2008). Comme pour le pyroséquençage, des adaptateurs sont ligaturés à des fragments d’ADN (Figure 18). Ils permettent la fixation des fragments à une puce sur laquelle se trouvent des amorces complémentaires en grande quantité. Une étape d’amplification « par pont » a ensuite lieu qui permet d’obtenir environ un millier de copies d’ADN simple brin.

Figure 18 : Représentation schématique de la méthode de séquençage à haut-débit Solexa.

Les clusters de fragments identiques ainsi créés sont analysés par séquençage en cours de synthèse (Figure 19). Les quatre types de nucléotides terminateurs réversibles sont incorporés : ces nucléotides sont des déoxynucléotides tri-phosphates auxquels a été ajouté un groupement O-azidométhyle en 3’. Ce groupement est un terminateur qui permet d’éviter que plusieurs nucléotides ne soient insérés sur le même fragment d’ADN au cours d’un cycle. De plus, chacun des quatre types de nucléotides possède un pigment fluorescent de couleur différente.

Après incorporation du nucléotide au brin d’ADN en cours de synthèse, un signal laser est émis. La fluorescence provoquée par cette excitation est enregistrée par une caméra CCD et permet d’identifier la position et la nature du nucléotide terminateur. Le signal fluorescent est quantifié, la base correspondante est identifiée et un score de qualité lui est également alloué.

Le groupement chimique responsable de la fonction terminatrice du nucléotide est ensuite retiré grâce à l’ajout de TCEP (tris(2-carboxyethyl)phosphine. Un second cycle peut alors commencer.

Figure 19 : Principe du séquençage en cours de synthèse.

Cette approche permet de séquencer un très grand nombre de fragments sur une puce (jusqu’à 320 millions de séquences). Cependant, la profondeur de lecture reste assez faible (150 pb).

2.3.2.3.3. Les autres méthodes de séquençage à haut-débit

La méthode ABI SOLiD débute par une étape identique à celle utilisée par la méthode 454 : les fragments de la librairie sont ligaturés à des billes, amplifiés par une PCR à émulsion, puis déposés sur un support. Le séquençage de ces fragments est en revanche très différent. Après fixation de l’amorce à l’adaptateur, des oligonucléotides de 8 pb sont hybridés au fragment d’ADN puis ligaturés. Ces octamères sont caractérisés par un marqueur fluorescent à leur extrémité, dont la couleur dépend de la nature d’un doublet de nucléotides (par exemple, du doublet contenant les nucléotides n°4 et 5). Après détection de la fluorescence, l’octamère est coupé après le dernier nucléotide du doublet (ici le 5), et le cycle de hybridation/ligation est recommencé.

Le processus de séquençage est répété en partant d’une amorce plus courte d’un nucléotide, ce qui permet de déterminer la séquences des doublets précédents. Le processus est recommencé autant de fois que nécessaire.

La méthode de séquençage HeliScope s’affranchit des étapes d’amplification en travaillant sur molécule unique. Pour cela, il faut que la caméra soit suffisamment sensible pour enregistrer un signal émis par une seule molécule. Les acides nucléiques sont fixés à une plaque de verre, sur laquelle sont ajoutés les réactifs de séquençage. Le séquençage est effectué en cours de synthèse, comme pour la méthode Solexa. Cependant, dans ce cas, la lecture est effectuée sur un brin, et non sur un cluster de séquences.

2.3.2.3.4. Utilisation des méthodes de séquençage à haut-débit en paléogénétique

Ces technologies sont particulièrement adaptées à l’étude de l’ADN ancien. En effet, elles permettent de séquencer un très grand nombre de fragments de courte taille (50 pb à 200 pb selon les techniques), qui sont les plus répandus dans un extrait d’ADN ancien. De plus, en évitant les amplifications ciblées, ces méthodes évitent qu’une contamination ne fausse drastiquement les résultats. Tout l’ADN d’un échantillon peut être séquencé de cette façon, sans sélection a priori. Ces nouvelles techniques de séquençage ont ainsi permis une analyse plus approfondie du génome nucléaire de spécimens anciens (Green et al., 2010; Rasmussen et al., 2010) et le séquençage des génomes mitochondriaux complets (Gilbert et al., 2008b;

Green et al., 2008; Willerslev et al., 2009; Edwards et al., 2010).

Cependant, leur utilisation soulève plusieurs problèmes. La quantité d’ADN endogène varie selon les échantillons. Elle est très faible dans les os, avec quelques pourcents d’ADN endogène : 1 à 5% des extraits d’échantillons néanderthaliens utilisés pour le séquençage d’ADN nucléaire (Green et al., 2010), 0,27% d’un extrait d’os de chèvre des Baléares (Ramirez et al., 2009), 0,7% pour un os de cheval, 1,8% pour une mandibule de loup (Blow et al., 2008). La seule exception est un os d’auroch du Mésolithique pour lequel 22% des lectures s’alignaient sur un génome de bovidé (Edwards et al., 2010). En revanche, les banques construites à partir de poils ou de tissus congelés contiennent une large proportion d’ADN appartenant à l’espèce étudiée : 45,4% pour un échantillon de mammouth conservé dans du permafrost (Poinar et al., 2006), 58% et 90% pour des poils de mammouth (Miller et al., 2008) et 84,2% pour des cheveux d’un paléo-eskimo (Rasmussen et al., 2010).

De plus, cette méthode reste sensible aux contaminations, en particulier lorsque les étapes précédant le séquençage ne sont pas réalisées dans des conditions rigoureuses. Ainsi, le premier séquençage à haut débit d’une banque construite à partir d’un échantillon néanderthalien (Green et al., 2006) a été largement contaminé par des séquences d’ADN humain moderne, avec de 40% à 78% des lectures attribuées aux primates appartenant à Homo sapiens sapiens (Wall & Kim, 2007; Green et al., 2008).

Dans le document The DART-Europe E-theses Portal (Page 55-60)