• Aucun résultat trouvé

CHAPITRE I Revue bibliographique

I. 1.2.4.1 Séquençage de 2 ème génération

La technique de séquençage De Sanger a atteint ses limites en termes de rendement. Il n’est plus possible d’accélérer le séquençage qu’en multipliant le nombre de gels, de capillaires ou de machines, et la vitesse d’électrophorèse peut difficilement être accélérée sans amoindrir la qualité de séquençage. C’est pourquoi de nouvelles technologies ont vu le jour pour aboutir à des séquenceurs temps réel (séquençage base par base) massivement parallélisés, utilisant des techniques très diverses tel que :

Le pyroséquençage à haut-débit (Technologie 454)

Les techniques de terminaison cyclique réversible (Solexa/Illumina et Helicos)

Le séquençage par ligation (SOliD).

Le séquençage par nano-mesure de PH (PGM)

Malgré leurs différences méthodologiques, les techniques de séquençage à haut débit actuellement offertes suivent un protocole dont les grandes lignes sont similaires (benthly 2008). Même si les méthodes utilisées à chacune des étapes sont différentes, l’ordre dans lequel elles sont effectuées est invariable :

H. Lemriss Thèse de doctorat Université Mohammed V-Rabat 32

 Préparation d’une librairie de séquences marquées par des adaptateurs ;

 Amplification des séquences marquées de manière à ce qu’elles soient séparées spatialement ;

Séquençage par réactions enzymatiques cycliques mesurées en temps réel.

 Pyroséquençage (technologie 454)

Le pyroséquençage est la technique qui connaît actuellement le plus grand succès concurrençant la méthode de Sanger. Cette technique de séquençage d’ADN introduite depuis 1988, par Hyman, a été améliorée par introduction d’une étape PCR. Il s’agit d’un séquençage par synthèse qui se caractérise par la révélation en temps réel de l’activité de l’ADN polymérase et qui ajoute un seul nucléotide non fluorescent à la fois.

La première étape consiste à préparer le mélange réactionnel, avec les enzymes clés et les différents substrats. Ici, les nucléotides ne sont pas ajoutés tous ensemble comme dans une réaction de séquençage de Sanger mais successivement. Si le nucléotide ajouté dans le milieu réactionnel correspond à celui attendu par la polymérase, il sera incorporé dans le brin en cours de synthèse (d’élongation) libérant un pyrophosphate. L’ATP sulfurylase vient alors transformer ce pyrophosphate (Ludwig et al., 2004) en ATP qui est alors utilisé, couplé à une Luciférine, par une luciférase avec production d’oxyluciférine et d’un signal lumineux. L’apyrase dégrade les nucléotides en surplus. Le signal lumineux est capté par un capteur CCD, puis reproduit sous forme d’un pic sur le Pyrogramme. La hauteur de ce pic est fonction de l’intensité du signal lumineux, elle-même proportionnelle au nombre de nucléotides incorporés en même temps. On peut donc déduire la séquence à partir de la taille des pics obtenus. Par ailleurs, en cas de mélange de nucléotides à une même position (polymorphisme de séquence), la taille des pics permet d’avoir une quantification de la proportion de brins porteurs de l’un ou l’autre des nucléotides (Figure I.10).

H. Lemriss Thèse de doctorat Université Mohammed V-Rabat 33 Figure I.10 : Etapes du pyroséquençage (Ahmadianet al., 2006).

La technologie de 454 Life Sciences conçue par Rothberg (Margulieset al., 2005) est fondée sur l’intégration de plusieurs techniques :

- le pyroséquençage,

- les technologies des plaques en fibre optique pico-titré (PTP), - la PCR en émulsion « emPCR » dans des microréacteurs,

- les technologies informatiques de pointe pour l’acquisition, le traitement et l’analyse des images.

Préparation de la libraire d’ADN (Figure I.11)

L’ADN génomique est fragmenté par nébulisation (1400-1800 pb), des séquences adaptateurs sont fixées à chaque extrémité des fragments d’ADN à séquencer. Un des adaptateurs contient un marqueur biotine en 5’ qui sert à fixer les fragments sur des billes grâce à un système streptavidine/biotine. Les fragments d’ADN sont dénaturés afin de libérer les brins non-biotinés, pour obtenir une librairie d’ADN simple brin.

H. Lemriss Thèse de doctorat Université Mohammed V-Rabat 34 Figure I.11 : Préparation de la libraire d’ADN (http://www.454.com/)

PCR en émulsion « emPCR » (Figure I.12)

Les sstDNA sont ensuite amplifiées par « emPCR ».Ces molécules sont fixées sur des billes de manière à fixer une seule molécule de sstDNA par bille. Les billes sont, ensuite, émulsionnées dans une solution eau/huile dans des proportions favorisant l’inclusion d’un seul couple bille-sstDNA par gouttelette d’eau, qui va agir comme un microréacteur pour la réaction de PCR. Après plusieurs cycles de PCR, chaque gouttelette contient une bille où sont fixés tous les clones amplifiés. Un ensemble de clones issus d’une même matrice est souvent dénommé «polonie» en référence à l’amplification de toute une colonie de clones par la polymérase.

Figure I.12 : Préparation des billes où sont fixées les sstDNA pour le séquenceur 454

(http://www.454.com/)  Pyroséquençage (Figure I.13)

Afin de paralléliser massivement les réactions de pyroséquençage, le séquenceur 454 utilise une PTP constituée de puits. Les billes couvertes de sstDNA sont mélangées au mix de réaction contenant la polymérase et sont étalées sur la PTP. Les puits de cette dernière sont

H. Lemriss Thèse de doctorat Université Mohammed V-Rabat 35

d’une forme telle qu’une seule bille peut être déposée dans chaque puits. Les puits et les billes de sstDNA sont ensuite recouverts de billes d’enzymes immobilisées contenant la sulfurylase et la luciférase. Au moment de pyroséquençage, chacune des bases A, C, G, et T est ajoutée séquentiellement sur la PTP. L’image des intensités de lumière émise par la réaction intervenue dans chaque puits après l’ajout de chaque base est enregistrée. Avant l’ajout de la base suivante, les bases non intégrées par la polymérase sont dégradées par une solution d’apyrase. Ce cycle d’ajout des quatre bases est réitéré 42 fois pour obtenir des séquences d’une longueur moyenne de 700 pb pour un total de 400 à 600 millions de bases séquencées (Shendure et Shendureet al., 2008; Metzker, 2010).

Figure I.13 : Schéma simplifié de Pyroséquençage sur PTP 454 (http://www.454.com/)

 Analyse des images et détermination de la séquence d’ADN

Connaissant l’ordre dans lequel les 4 nucléotides sont ajoutés automatiquement, l’analyse des différentes images capturées permet la déduction de la séquence des différents fragments d’ADN (illustré par Pyrogramme). Des logiciels bioinformatiques sont ensuite utilisés pour reconstituer la séquence initiale grâce au groupage des contigs. Cette technologie produit de longues séquences qui facilitent l’assemblage de novo des génomes sans utiliser un génome de références. En quelque année, la longueur des séquences est passé d’environ 300pb à 700pb et aujourd’hui, la mise à jour de l appareil permet d’atteindre des séquences d’environ 1Kb. Ainsi, une expérimentation sur GS-FLX+génère 1Gb de nucléotide en 23h (Loman et

al., 2012; Jûnemann et al., 2013).. Ces capacités technologiques en font aujourd’hui un outil

indispensable dans les études génomiques et transcriptomiques qui requière un assemblage de novo. En 2013, la société Roche a annoncé qu'elle prévoyait d'arrêter la commercialisation de la technologie 454 d'ici mi-2016 (www.genomeweb.com).

H. Lemriss Thèse de doctorat Université Mohammed V-Rabat 36

 Techniques de terminaison cyclique réversible (Illumina /Solexa)

Initialement développée par Solexa, la plateforme Illumina Genome analyser (Sandiego, USA), a mis en place une technologie de séquençage sur lames de type puces à ADN, fondée sur l’intégration de plusieurs techniques : les biopuces à ADN, la nanotechnologie, une variante de la technique de Sanger appelé terminaison cyclique réversible (CRT), ainsi que des technologies informatiques de pointe pour l’acquisition, le traitement et l’analyse des images (Fedurco et al., 2006).

La spécificité de cette technologie repose sur une amplification en pont (bridge PCR) des fragments à séquencer. Elle a lieu sur une surface de verre appelée flow cell (FC), similaire à une lame de microscope, divisée en huit lignes (à l'origine, une ligne par échantillon). Les fragments de la librairie à séquencer possèdent des adaptateurs à leurs extrémités. Ceux-ci vont leur permettre de se fixer de façon aléatoire sur la FC, par hybridation sur les amorces qui en couvrent la surface (Figure I.14). Un nouveau brin est alors synthétisé par une polymérase (a) : il est fixé de façon covalente à la FC. Le brin d'origine est alors éliminé par dénaturation (b) et l'extrémité libre du brin restant s'hybride à une amorce adjacente pour former un pont (c). La polymérase synthétise à nouveau le brin complémentaire pour former un pont d'ADN double brin (d) puis les deux copies sont libérées par dénaturation (e). Le cycle d'amplification en pont (étapes c à e) recommence pour former à terme un regroupement d'ADN clonal en une zone appelée cluster (f). Les brins anti-sens (correspondant aux amorces vertes) sont ensuite clivés (g) : c'est la linéarisation.

L'extrémité 3' libre des fragments d'ADN est bloquée et l'amorce de séquençage s'y hybride (Figure 14). Le séquençage s'effectue sur des centaines de millions de clusters simultanément, grâce à une chimie de terminateurs réversibles : des nucléotides bloqués marqués par fluorescence sont ajoutés, l'un d'entre eux est incorporé, la fluorescence émise est relevée puis le fluorophore et le bloqueur sont clivés permettant l'ajout d'un nouveau nucléotide. A chaque cycle d'incorporation, une base peut être déterminée. (Eid et al., 2009).

H. Lemriss Thèse de doctorat Université Mohammed V-Rabat 37 Figure I.14 : Amplification en pont de la technologie Illumina ((http://www.illumina.com/)

H. Lemriss Thèse de doctorat Université Mohammed V-Rabat 38

Aujourd’hui le système HiSeq 2000 possède un rendement de 6 milliards de séquences pour un total d’environ 600 Gb en 11 jours (avec une taille moyenne de séquence de 100 pb). Cette technologie est aujourd’hui très largement employée (séquençage, reséquençage, Chip-Seq, RNA-Seq).

 Séquençage par ligation (SOliD)

La plateforme SOLiD (Sequencing by Oligonucleotide Ligation and Detection) du système décrit par Shendure et al., 2005, emploie des processus de préparation et amplification d’échantillons similaires à ceux développés pour la technologie 454. Mais le processus de séquençage diffère considérablement, dans le fait qu’il repose sur un séquençage par «ligation», où des oligonucléotides de 8 bases marqués par fluorescence sont liés de manière séquentielle sur l’amorce de séquençage. Chacun des quatre types de sonde porte un fluorophore distinct en 3’, représentant la séquence de l’échantillon complémentaire aux quatrièmes et cinquièmes bases de la sonde oligonucléotidique. Le signal fluorescent généré par l’hybridation de la sonde est alors détecté et enregistré par un scanner laser et un processus d’acquisition de données similaires au système Solexa. La sonde liée est alors clivée entre la 5ème et 6ème base, enlevant la moitié fluorescente, et des séries répétées de la ligation de la sonde (Metzker, 2010).

Grâce à cette méthode, il est possible de lire jusqu'à un milliard et demi de séquences en parallèle de 75 bases de long (des fragments courts). Le système incorporé de correction d'erreurs associé à l'utilisation de la ligase rend cette technologie très fiable et utilisable dans des projets de reséquençage de génome et de transcriptome.

 Séquençage par nano-mesure de PH (PGM)

En 2007, Jonathan M. Rothberg fonde la compagnie Ion Torrent, rachetée en 2010 par Life Technologies, qui commercialisera en décembre 2010 son premier séquenceur, le PGM (Personal Genome Machine) pour 50000 $. La technologie utilise une méthode de séquençage par synthèse, similaire au pyroséquençage, basée sur la libération naturelle d’un ion H+ lors de l’incorporation d’un nucléotide à un fragment d’ADN en cours de production. La séquence est déterminée par mesure des variations de pH suite à l’incorporation des différents nucléotides, au sein d’une puce semi-conductrice. Ce système de détection « simple » ne

H. Lemriss Thèse de doctorat Université Mohammed V-Rabat 39

nécessitant ni système optique ni marqueur fluorescent, font de la technologie Ion Torrent une méthode de séquençage rapide et peu couteuse par rapport aux autres plateformes NGS. La dernière version de ce séquenceur (puce 318) lui permet désormais de lire 1 Gb avec une grande précision en seulement deux heures et la longueur de lecture atteindra les 400 pb en 2012. Le PGM a ainsi servi à décoder le génome de la souche d'Escherichia coli qui a fait des ravages en Europe et provoqué un scandale sanitaire en mai 2011 (Mellmann et al., 2011).

Documents relatifs