• Aucun résultat trouvé

Séquençage de troisième génération

sequences September 2012 450 481 663 919

1.3. Génomes et génomique

1.4.4. Séquençage de troisième génération

fluorophore, en laissant une extrémité 5' disponible pour la ligature de la sonde suivante. Le séquençage se déroule en sondant deux bases et en sautant trois jusqu'à la fin du fragment. Le cycle est réinitialisé cinq fois en utilisant des amorces de tailles différentes de telle sorte qu’à la fin, chaque base a été interrogée deux fois (Valouev et al. 2008). Le rendement de cette technologie est de 3 Gb par run, mais le traitement informatique notamment le système de codage couleur rend l’analyse relativement complexe.

Finalement, la technologie IonTorrent de ThermoFisher utilise également l’emPCR pour générer les banques d’ADN matrice et les dNTP sont également incorporés de manière séquentielle. Cependant la méthode de détection diffère : lorsqu'un dNTP est incorporé, l'ADN polymérase libère un proton (ion H+) provoquant un changement de pH qui est détecté par une puce semi-conductrice (Rothberg et al. 2011). Ce fut la première technique qui n'utilisa plus l'optique pour lire la séquence d’ADN. Avec ce système, le débit est de jusqu’à 1 Gb en moins de 2 heures.

Une des améliorations de ces SGS est le séquençage appelé paired-end qui consiste à séquencer les deux extrémités d'un même fragment d'ADN matrice. Les deux reads sont indépendants, mais ils proviennent de la même molécule (ils sont appariés) et la taille du fragment qui les sépare, l'insert, peut être estimée (Risca and Greenleaf 2015).

Comme indiqué antérieurement, une des caractéristiques majeure de toutes ces technologies est l'amplification par PCR de l'ADN matrice préalable au séquençage. Cependant, des biais ou des erreurs peuvent être introduits lors de cette amplification (Kircher and Kelso 2010). D’où une troisième génération des techniques de séquençage qui tentera de remédier à ce problème.

1.4.4. Séquençage de troisième génération

La grande révolution des méthodes de troisième génération de séquençage (TGS) est la fin de l'utilisation de la PCR pour amplifier l'ADN matrice (techniques appelées

single-molecule) et le séquençage de fragments de grande longueur (long-read).

La première méthode est l'HeliScope de Helicos. L'ADN est fragmenté (100 à 200 nt) et un adaptateur poly-A marqué avec un fluorochrome est lié à la matrice monocaténaire. Les fragments sont immobilisés par un oligomère de poly-T sur un support solide. Un laser excite

les fragments et une caméra détecte leur position. L'ajout séquentiel des dNTP marqués est détecté par la caméra, puis le fluorochome est clivé et le processus peut itérer jusqu'à la fin du fragment (Harris et al. 2008). Cet appareil n’est plus disponible à la vente et Helicos s’est converti en société de service de séquençage.

La technologie Single-Molecule Real-Time (SMRT) de Pacific Biosciences ou PacBio est le premier appareil capable de séquencer une molécule unique en temps réel. Il utilise une structure composé de cellules SMRT possédant chacune 75 000 nanostructures appelés Zero-Mode Waveguide (ZMW) et possédant chacune une ADN polymérase immobilisée au fond qui incorpore des dNTP couplés à un fluorophore et dont l'excitation laser entraîne son clivage, permettant un détection en permanence, en temps réel (Eid et al. 2009). Cette technologie permet d'obtenir des reads appelés long-reads de 5 à 20 Kb, ce qui est un progrès considérable par rapport aux techniques précédemment citées. Toutefois, un des problèmes majeurs de cette technologie est l’énorme taux d'erreur qui est proche des 15%, erreurs aléatoires qui peuvent être corrigées ensuite algorithmiquement (Rhoads and Au 2015).

La dernière technologie en date est celle d'Oxford Nanopore. La révolution de cette technologie est qu'elle n'utilise pas d'ADN polymérase et ne synthétise pas de brin complémentaire. La technique repose sur des pores protéiques (les nanopores) insérés dans une bicouche lipidique qui autorise le passage unidirectionnel d'un ADN simple brin. Ce passage produit un changement de courant électrique ou un potentiel qui diffère si le nanopore est obstrué par un A, un T, un G ou un C (Haque et al. 2013). Comparée aux techniques enzymatiques précédentes (polymérisation, ligation), le séquençage par nanopore nécessite moins de manipulations et un volume d'échantillon très faible. La technique est donc peu coûteuse mais a encore un fort taux d’imprécision. C’est toutefois une technologie en rapide évolution avec des améliorations constantes.

D'autres méthodologies comme la lecture directe des bases azotées par microscopie électronique (Bell et al. 2012) ont été proposées. Ces méthodes directes pour le séquençage sont parfois appelées de quatrième génération (Feng et al. 2015). Cependant l'introduction de nouvelles méthodes comme le single-cell sequencing (Gawad et al. 2016) qui pour le moment continue à dépendre d'une amplification (Whole-Genome Amplification ou WGA) et, surtout, le in situ sequencing (Nawy 2014) sont en train de changer, encore une fois, le paysage du séquençage. Même si pour le moment, ces méthodologies sont encore en développement et que quelque temps sera nécessaire pour leur mise en place et utilisation courante, les

Figure 15. Format FastQ. Début d'un fichier au format fastq. L'information de chaque read est codée en quatre lignes, la première est un identifiant, la deuxième est la séquence des bases, la troisième commence toujours par un "+" et peut répéter ou non l'identifiant et la dernière ligne correspond aux qualités liées à chaque base, codées en Phred-33.

@m160720

CTTGGACATTGCGGAAGCAG

+

$$+*-,%/-&-.,,'#,.//

Entête ou identifiant Séquence Qualités associées

Base T avec un score de qualité codé par un "+" (caractère nº43 de l'ASCII) donc correspond à une qualité de 10, c'est-à-dire une possibilité de 1/10 d'être incorrect.

bénéfices pourraient être importants pour mieux décrire la diversité génomique dans une population de cellules (Gawad et al. 2016) et même le coupler à leur localisation spatiale dans un tissu ou biofilm (Ke et al. 2016; Nawy 2014).