• Aucun résultat trouvé

PARTIE 1 : Synthèse bibliographique et présentation des objectifs de cette thèse

4 Analyse de transcriptomes

4.2 Séquençage haut débit

fluorochromes. Il est à noter que cette méthode n’est plus réalisée en laboratoire de nos jours, car elle est trop longue et très coûteuse.

4.2 Séquençage haut débit

Les améliorations de la méthode de séquençage de Sanger ont conduit cette technique à atteindre son rendement maximum. Les seules possibilités d’accélération sont la multiplication des gels et capillaires, des séquenceurs, car si la vitesse d’électrophorèse est augmentée cela causerait une diminution de la qualité du séquençage. De nouvelles technologies ont été créées et elles permettent le séquençage base par base en temps réel. Il existe actuellement principalement quatre technologies haut débit, une cinquième est en cours de développement depuis 1995 (Rusk, 2009). Celle-ci utilise des nanopores, mais elle doit encore faire face à de nombreux défis technologiques avant d’être mise sur le marché.

4.2.1 Technologie 454 (Roche)

Le séquenceur 454 mis au point par Roche repose sur une technique de pyroséquençage (Figure 26-E, p. 74) (Ronaghi et al., 1998). Au cours de l’élongation, à chaque fois qu’un dNTP est utilisé par l’ADN polymérase, une molécule de pyrophosphate inorganique (PPi) est relâchée. La mesure de la quantité de PPi produite est réalisée à l’aide d’ATP sulfurylase, de luciférase, d’adénosine 5’phosphosulfate et de luciférine. Lorsqu’une molécule de PPi est relâchée, l’ATP sulfurylase le converti en ATP à partir de l’adénosine 5’phosphosulfate. La luciférase utilise alors cet ATP pour convertir la luciférine en oxyluciférine. Cette dernière réaction émet un signal lumineux proportionnel à la quantité d’ATP utilisée et donc de dNTPs incorporés.

La technologie 454 nécessite la préparation d’une librairie d’ADN simple brin en vue du séquençage. Cette approche peut être utilisée pour séquencer soit de l’ADN génomique (ADNg), soit des ARN messagers (ARNm) au préalablement rétrotranscrits en ADN complémentaires (ADNc). L’ADNg est au préalable fractionné par des traitements physiques (nébullisation). Les ARNm étant généralement de petite taille, ce fractionnement n’est pas nécessaire lorsqu’on souhaite séquencer un transcriptome. Les fragments d’ADNg oud’ADNc obtenus sont ligués à des séquences adaptatrices (ou adaptateurs) à leurs extrémités (Figure 26–A, p. 74). Un de ces adaptateurs comporte une biotine en 5’ qui va servir à fixer les fragments sur les billes grâce à un système streptavidine/biotine. Les fragments d’ADN sont ensuite dénaturés, seules les séquences simple brin possédant les deux adaptateurs sont conservées en vue d’être séquencées. Les fragments d’ADN simple brin sont ensuite fixés sur des microbilles à raison d’un fragment par bille (Figure 26-B, p. 74) puis sont amplifiés grâce à une PCR par émulsion (emPCR) : les

74

billes sont émulsionnées dans un mélange eau/huile afin d’inclure un seul couple bille-ADN simple brin par gouttelette d’eau. Chaque gouttelette fonctionne comme un puits pour la réaction de PCR. A la fin de la réaction de PCR, chaque gouttelette contient une bille sur laquelle sont fixés tous les fragments amplifiés (Figure 26-C, p. 74).

Figure 26 : Représentation schématique des différentes étapes du pyroséquençage 454 de Roche (source : http://www.454.com/).

Les billes ainsi couvertes de clones d’ADN simple brin sont alors additionnées au mélange réactionnel contenant l’ADN polymérase et étalées sur une microplaque comprenant plusieurs centaines de milliers de puits (le diamètre d’un puits est inférieur à 45µm) (Figure 26-D, p. 74). La puce est conçue de manière à ce qu’un puits ne puisse contenir qu’une seule bille. Les puits sont ensuit recouverts par des billes ayant à leur surface la sulfurylase et la luciférase. Le pyroséquençage est effectué avec l’ajout de chacune des bases de manière séquentielle (Figure 26-E, p. 74). Les intensités de lumière émises sont enregistrées sur chaque puits grâce à un capteur adapté après l’ajout successif de chaque base. Les bases non utilisées sont finalement dégradées par une solution contenant une apyrase. Les cycles successifs contenant les différentes bases sont généralement réalisés 42 fois et conduisent à l’obtention de séquences ayant une longueur moyenne de 100 pb avec un total de 20 millions de bases séquencées en 4h30 (sur l’ensemble de la microplaque). Le séquenceur 454 GS20 utilise une puce qui contient 200 000 puits d’environ 44 µm de diamètre, ce qui permet d’effectuer des réactions de séquençage en parallèle de manière massive. Le séquenceur 454 FLX Titanium utilise quant à lui des puces ayant une capacité de plus d’un million

75

de puits. Les séquences ainsi obtenues ont une longueur moyenne de 500 pb avec un total de 400 à 600 millions de bases séquencées en 10 h.

4.2.2 Technologie Illumina Solexa

La technologie Illumina est fondée sur des principes identiques à ceux de la technologie 454. La parallélisation du séquençage repose également sur l’utilisation d’une matrice de clones attachés à une surface solide, et le séquençage s’effectue toujours en temps réel. Néanmoins, avec la technologie Illumina, le séquençage s’effectue grâce à des fluorochromes fixés aux dNTPs. Comme pour la technologie 454, il est nécessaire de préparer une librairie d’ADN simple brin pour le séquenceur Solexa. Des adaptateurs sont fixés aux extrémités des fragments d’ADN (ADNg fragmenté par nébullisation ou ADNc correspondant aux ARNm présents dans la cellule). Ces morceaux d’ADN sont ensuites dénaturés et hybridés à des amorces complémentaires aux adaptateurs. Ces amorces auront au préalable été fixées sur une lame. Après une phase d’élongation et de dénaturation, les fragments simple brin obtenus forment un pont au niveau du support grâce à une autre amorce fixée à proximité. Ces fragments sont alors réamplifiés afin de former une structure « en pont » double brin. L’ADN est à nouveau dénaturé et les fragments simple brin obtenus forment également des ponts sur le support. Cette étape est répétée 35 fois pour former des clusters de 2 000 fragments. Les fragments ainsi obtenus sont ensuite séquencés en ajoutant un mélange des quatre dNTPs terminateurs marqués. Ces dNTPs terminateurs ont la particularité d’agir comme des ddNTPs, ils bloquent la polymérase après avoir été incorporés. Néanmoins, ces dNTPs terminateurs ont la capacité d’être réversibles. Lorsque la première série de dNTPs terminateurs est incorporée, les intensités lumineuses des différents fluorochromes sont enregistrées. Les dNTPs terminateurs sont alors inactivés et un nouveau cycle peut commencer.

4.2.3 Technologie Helicos tSMS

La technologie du séquenceur Helicos tSMS (True Single Molecule Sequencing) est une amélioration de la technologie Illumina. Le détecteur de l’Helicos tSMS est extrêmement performant et est capable d’enregistrer la fluorescence émise par un seul brin d’ADN. Aucune amplification préalable n’est donc nécessaire. Les fragments d’ADN à séquencer sont fixés sur une surface plane avec une densité très élevée. Les fragments séquencés ont une longueur moyenne de 50 pb et ce séquenceur a la capacité de séquencer plus de 3 milliards de bases par jour.

76

4.2.4 Technologie Applied Biosystems SOLiD

La technologie Supported Oligo Ligation Detection (SOLiD) a été créée par la société Applied Biosystems. L’étape de préparation de la librairie est comme pour la technologie 454, réalisée par une PCR en émulsion. A la fin de cette étape, les extrémités 3’ des ADN simple brin sont modifiées avec un adaptateur pour permettre leur fixation sur une plaque de verre. Chaque brin d’ADN est alors associé à une amorce à proximité de lui pour permettre sa réplication. La particularité de cette technologie réside dans le fait qu’elle n’utilise pas de polymérase au cours du séquençage, mais une ADN ligase. Le séquençage est basé sur un mélange réactionnel d’oligonucléotides marqués par des fluorochromes. Cette technologie génère des séquences de 50 pb environ et peut séquencer plus de 2 milliards de bases par jour.

4.2.5 Et dans le futur ?

Avec l’essor de l’automatisation et des nouvelles technologies de séquençage, le séquençage est devenu de plus en rapide et abordable. Alors qu’il a fallu près de 10 ans pour entièrement séquencer le génome humain, il est possible avec les technologies actuelles de le faire en une seule journée. D’ailleurs certaines célébrités ont récemment fait séquencer leur génome (Levy et al., 2007; Wheeler et al., 2008). Le séquençage complet de génomes pourrait permettre l’étude de variations génétiques sur une grande population, mais permettrait également de traiter spécifiquement certains patients. Même si les capacités journalières de séquençage des séquenceurs haut-débit sont 300 à 1100 fois plus élevées que celle d’un séquenceur classique, ces technologies présentent en général un taux d’erreur de 1 à 2 % (Schröder et al., 2009) alors que les séquenceurs classiques ont un taux d’erreur de 1 pour 10 millions (Mandel et al., 2008). De plus, ces nouveaux séquenceurs produisent des séquences de 50 à 500 pb contre 1200 pb pour un séquençage classique. Ces séquenceurs haut-débit nécessitent donc de lourds traitements d’assemblage de données. Des méthodes alternatives se sont également développées ces dernières

années pour réaliser des séquençages de très long fragments d’ADN (PACBIO,

www.pacificbiosciences.com) et deviendront vraisemblablement les méthodes de séquençage de génome de référence dans les années à venir. La course est lancée à celui qui proposera en premier le séquençage du génome humain en une journée pour 1000 dollars.