• Aucun résultat trouvé

La principale différence de protocole entre un séquençage « classique » et une expérience d’immunoséquençage réside dans la préparation de la librairie de fragments d’ADN qui serviront de matrice pour le séquençage. Dans le cadre d’un séquençage TCR, cette librairie est enrichie en fragments d’ADN génomique ou complémentaire codant le domaine variable de la chaîne d’intérêt, grâce à l’utilisation de combinaisons d’amorces ciblant les gènes TRA ou TRB lors des cycles d’amplifications (Figure 10). En effet, le séquençage des deux chaînes du TCR se fait généralement séparément. Bien que de plus en plus performants, les protocoles permettant de capturer simultanément les séquences des deux chaînes exprimées par les cellules ne sont pas encore devenus routiniers du fait de leur complexité d’exécution et

d’analyse (DeKosky et al., 2013; Howie et al., 2015). Parmi les protocoles d’amplification mis au point, la technique Rapid Amplification of cDNA-ends ou RACE implique la fixation par PCR d’une ancre dont la séquence connue est incorporée à l'une des extrémités de la région d’intérêt, ici en 5’ au niveau du gène TRC. Puis, la région est amplifiée en combinant une amorce complémentaire à l’ancre et une amorce ciblant le gène d’intérêt. Cette approche, bien que particulièrement efficace et appréciée, reste peu utilisée par les biologistes car elle est difficile à implémenter du fait de la sensibilité de certaines étapes du protocole et du prix onéreux du kit proposé par ThermoFisher©. Toutefois, de plus en plus d’équipes arrivent à mettre en place avec succès cette procédure (Bolotin et al., 2012; Freeman et al., 2009; Quigley et al., 2010; Warren et al., 2009).

Une autre approche, appelée TCR gene-capture, utilise une librairie ADN composée de séquences connues, telles que les gènes TRA et/ou TRB référencées par la base IMGT (International Immunogenetics Information System) (Lefranc et al., 2005). Comme décrit par Linneman et al. (2013), ces séquences vont ensuite « capturer » par complémentarité les séquences ARN d’intérêt présentes dans l’échantillon pour les amplifier. Cette technique a l’avantage de permettre de cibler les deux chaînes simultanément mais ne semble pas optimale pour assurer l’amplification de toutes les molécules TR en présence.

Figure 10 : Exemples de stratégies de préparation des librairies d’ADN – A) Amplification par PCR

librairie à partir d’ARN messager. Dans les deux cas, l’amplification se fait via une stratégie de PCR multiplexe utilisant un mélange d’amorces complémentaires aux différents gènes V (en rouge) qui peut éventuellement être combiné à un mélange d’amorces ciblant les gènes J (en bleu). L’incorporation d’adaptateurs (en gris) permet de capturer les séquences. Dans le cas de l’ARNm, une amorce unique ciblant la région C (violet) peut être utilisée.

Du fait de la dominance d’Illumina sur le marché du séquençage, le choix de la plate-forme n’est plus d’actualité. Toutefois, ce non-choix reste discutable en ce qui concerne l’immunoséquençage. En effet, les séquences produites par 454 étant plus longues, elles couvrent la totalité de la région CDR3 ainsi que les segments V et J, ce qui n’était pas le cas des séquences Illumina qui doivent être appariées pour couvrir la région d’intérêt (on parle de séquençage « pair-ended »), entraînant un risque d’erreur (Hou et al., 2016). De plus, alors que dans le cadre d’un séquençage génomique ou transcriptomique « classique », il est possible de corriger une erreur de séquençage sur la base de séquences « références ». Lorsque l’on s’intéresse à une séquence variable telle que le CDR3 pour laquelle, par définition, on ne dispose pas de séquences de référence, il n’est pas possible d’identifier les séquences erronées. Ainsi, le taux d’erreur global plus faible de la technologie 454 aurait semblé plus pertinent pour minimiser le taux de « faux-positif ». Malgré cela, la grande différence de performance entre les deux technologies rend la technologie 454 beaucoup moins intéressante d‘autant plus qu’un grand effort a été fourni par de nombreuses équipes pour développer des algorithmiques permettant la correction a posteriori des erreurs de séquençage (Salmela and Schröder, 2011; Shugay et al., 2014; Thomas et al., 2013b).

Récemment, Brown et son équipe ont analysés le répertoire TCR à partir de données de séquençages transcriptomiques complets (Brown et al., 2015). Ainsi, en analysant les données de RNAseq de 6738 échantillons tumoraux, disponibles dans la base de données TCGA (The Cancer Genome Atlas), ils ont évalué qu’avec un processus adéquat de traitement et d’extraction des données, des séquences TR pouvaient être identifiées avec un rendement de 1 pour 10 millions de séquences. Leur méthodologie leur a ainsi permis d’identifier des séquences CDR3 α et β qu’ils qualifient de « spécifiques de tumeur ». D’après les auteurs, cette approche mettrait donc « en échec » le séquençage spécifique du CDR3 pour permettre une analyse systémique intégrant non seulement la « diversité » du répertoire TCRαβ et le contexte transcriptomique global. Or, bien que très attractive, cette approche reste néanmoins problématique. En effet, le rendement de détection des séquences TR exige une profondeur de séquençage bien supérieure à la norme actuelle. De plus, et c’est là le problème

majeur, si l’identification de quelques clones est suffisante pour caractériser le profil TCR de tumeurs dont le répertoire perturbé contient des (quelques) expansions clonales majeures (Jang et al., 2015), il ne semble pas envisageable d’appliquer la même approche dans un contexte plus polyclonal.

Comme revu par Calis et Rosenberg (Calis and Rosenberg, 2014), les différentes stratégies de séquençage du CDR3 présentent toutes des avantages et des inconvénients (Bolotin et al., 2012) qu’il est nécessaire d’avoir à l’esprit lors de la définition des stratégies expérimentale et analytique d’une expérience.