• Aucun résultat trouvé

Les technologies de séquençage à haut débit ont été utilisées avec le projet du génome humain. Le premier génome humain à être séquencé, a pris plusieurs années et des millions de dollars et a été réalisé avec le séquençage de Sanger [95]. Le séquençage à haut débit est une méthode qui est apparue durant les années 2000. Ces nouvelles méthodes de séquençage permettent d’obtenir un grand nombre d’informations sur l’ADN, l’ARN ou les protéines, et ce, à faible coût. Ces techniques s’effectuent rapidement, ce qui a aidé au projet de séquençage de 1000 génomes humains [96,97]. Ces nouvelles techniques permettent de faire des analyses systématiques en transcriptomique, protéomique, épigénomique et en métagénomique. Le but de ces techniques est d’obtenir de l’information sur tout le génome et non seulement sur quelques gènes [98]. La plus grande sensibilité du séquençage à haut débit comparativement au séquençage Sanger permet de trouver des mutations dans des petites portions du génome [99]. Un des avantages du séquençage à haut débit est la possibilité de regarder les mutations, les réarrangements chromosomiques et la variation du nombre de copies en une seule plateforme [100,101]. Ces techniques de séquençage à haut débit permettent de comprendre des mécanismes moléculaires dans la cellule et sont donc de plus en plus importantes dans la recherche [98,102]. Un exemple de la compréhension de certains mécanismes moléculaires a été démontré par Huber- Keener et al. Ils ont regardé les gènes différentiellement exprimés entre les cellules cancéreuses du sein qui sont résistantes ou non au tamoxifène. Cette étude permet donc de déterminer les gènes impliqués dans le mécanisme du développement de la résistance à cet agent dans les cellules [103]. Une autre étude du même genre a permis de trouver des gènes associés avec une cytotoxicité reliée au traitement avec des agents chimiothérapeutiques sur des

18

lignées de lymphocytes immortalisés [104]. Le séquençage à haut débit a aussi permis d’obtenir de l’information sur le processus d’épissage alternatif qui se produit dans la cellule [105].

3.1. «RNA sequencing»

Cette technique est une méthode de séquençage à haut débit utilisée pour faire l’analyse transcriptomique. Tel que présenté à la figure 7, cette méthode consiste en l’extraction de l’ARN pour ensuite faire la fragmentation de celui-ci et la production d’ADN complémentaire (ADNc) [106]. Ces deux dernières étapes peuvent aussi être inversées (figure 7a). Des séquences adaptatrices ont ensuite été ajoutées aux fragments pour former une librairie (figure 7b). Ces séquences adaptatrices permettent aux fragments de s’attacher à une puce par complémentarité. Les fragments sont ensuite amplifiés à l’aide d’une polymérase pour avoir une copie de chaque brin attachée à la puce. Puis, les brins sont dénaturés et le fragment de départ est enlevé. La formation de pont PCR avec des séquences complémentaires aux séquences adaptatrices permet une amplification des fragments. Cette amplification crée des milliers de regroupements d’ADNc provenant de tous les fragments de départ. Les fragments de sens inverses sont par la suite enlevés et seulement les brins restants sont séquencés [96]. La séquence adaptatrice sert d’amorce au séquençage et des bases fluorescentes entrent en compétition pour s’attacher aux fragments. Seules les bases complémentaires vont pouvoir s’attacher. Une lumière excite alors la base et une couleur spécifique est émise par la base ajoutée pour chaque regroupement. Ce mécanisme est produit de façon cyclique et la couleur émise est enregistrée par la machine et des fragments de séquences connues sont obtenus (figure 7c). Les mêmes étapes sont ensuite faites pour le brin inverse. Tous les fragments de séquence obtenus sont alors alignés pour former des contigs. Les contigs sont ensuite alignés sur le génome de référence. L’alignement à l’aide de cette méthode permet de déterminer les transcrits qui sont présents dans la cellule et permet aussi de déterminer l’importance de ces transcrits [107].

19

Figure 7 : Étapes de la réaction de «RNA sequencing»

Pour une expérience typique de séquençage à haut débit «RNA sequencing», il y a extraction d’ARN qui est rétro-transcrit pour former une librairie de longueurs égales. Figure traduite de LIN WANG et al [106].

Plusieurs avantages et inconvénients sont reliés à cette technologie. En effet, plusieurs avantages sont remarquables en comparant avec les biopuces d’expression génique étudiant le transcriptome humain [107]. Premièrement, le problème de choix des sondes utilisées pour chaque expérience ne se retrouve pas avec la technologie de «RNA-sequencing», ce qui évite de passer à côté

A

C

B

ou

Transcrip oninverse Fragmenta onde l’ARN Transcrip on inverse Fragmenta onde l’ARN ARNm ARN ADNc librairie Adapteurs Réac ons cycliques Capture d’images Iden fica on de bases Valida on de séquence Misesur puces

20

d’informations importantes [108]. De plus, il n’y a pas de saturation du signal possible, ni de problème de détection affecté par l’hybridation croisée [109,110]. D’ailleurs, la technique de RNA-seq permet une détection d’un signal qui est beaucoup plus faible que ce que les biopuces permettent et il est possible de voir une différence dans l’expression plus facilement [111]. Cette méthode permet aussi de découvrir de nouveaux transcrits ce qui est un avantage [112]. À l’inverse, certains désavantages sont aussi reliés avec cette technologie comme le fait qu’il faut une grande quantité de matériel biologique au départ [107]. De plus, le coût par échantillon est plus faible pour les biopuces que pour le RNA-seq [111]. Finalement, il faut une grande capacité de stockage de l’information ainsi que plusieurs outils de traitement des données obtenues ce qui peut créer un biais [113].

3.1.1. «RNA sequencing» dans le cancer

La technique de «RNA sequencing» permet d’étudier le transcriptome pour chaque individu. Il est donc possible de trouver les transcrits différentiellement exprimés entre ceux-ci. Depuis l’apparition de cette technologie, un grand nombre d’études ont été réalisées pour étudier la différence dans le transcriptome entre des individus atteints et non atteints de cancer à l’aide de la méthode «RNA sequencing». Jakhesara et al. ont étudié la différence d’épissage alternatif entre des cancers buccaux et des tissus normaux [114]. À l’aide du programme web DAVID [115], ils ont pu faire une analyse fonctionnelle des gènes différentiellement exprimés ce qui leur a permis de mieux comprendre le grand nombre de données qui étaient à leur disposition [115,116]. Eswaran et al. ont regardé les transcrits différentiellement exprimés dans le cancer du sein [117,118]. Ils ont utilisé le tissu de trois types de cancer du sein; le cancer du sein triple négatif, le cancer du sein non triple négatif et le cancer du sein HER2 positif. Avec leur approche, ils ont pu confirmer plusieurs gènes qui avaient été rapportés dans la littérature comme étant différentiellement épissés dans le cancer du sein tels que CDK4, LARP1, ADD3 et PHLPP2 [119-123]. D’autres études du même genre ont été faites sur plusieurs types de cancers pour trouver les variants d’épissage alternatif qui sont

21

différentiellement exprimés entre les patients atteints et non atteints [124-126]. Une étude a aussi été effectuée par Danan-Gotthold et al. sur un grand nombre de patients atteints et non atteints pour huit types de cancers différents [127]. Ils ont trouvé que des régulateurs spécifiques de l’épissage comme RBFOX2, MBNL1/2 et GK1 seraient responsables du changement d’épissage alternatif, et ce, pour plusieurs types de cancers. Yang et al. ont utilisé des valeurs de «RNA sequencing» pour faire l’analyse des gènes et sentiers impliqués dans un type de cancer du rein [128]. Ils ont pu confirmer certains sentiers métaboliques qui étaient rapportés dans la littérature comme étant associés avec ce cancer, tel que le sentier signalétique de PPAR.

Documents relatifs