• Aucun résultat trouvé

Évolution de l’approche en parallèle de la technologie

De nombreuses approches ont été développées pour estimer la diversité des répertoires immunitaires (Six et al., 2013). Le répertoire TCR étant un système multi-entitaires, il peut être observé par différentes approches dont la granularité a varié avec les progrès technologiques tel que revu par (Boudinot et al., 2008).

Le répertoire TCR peut être décrit au niveau protéique par cytométrie en flux en utilisant des anticorps monoclonaux spécifiques des familles V de la chaîne β (BV) mesurant ainsi leur fréquence d’utilisation au sein d’une population lymphocytaire donnée (Ciupe et al., 2013; Salaün et al., 1990; Thomas-Vaslin et al., 2012). Bien que cette approche permette une analyse qualitative et quantitative du domaine Variable des TCR, elle est limitée par la disponibilité des anticorps monoclonaux et ne permet pas d’évaluer la diversité de la jonction CDR3. D’autres approches protéomiques plus sensibles telles que le PANAMA-blot (Nobrega et al., 1993) furent développées pour l’analyse du répertoire des lymphocytes B mais ne sont pas applicables pour le TCR.

L’analyse moléculaire du répertoire TCR peut se faire tant quantitativement que qualitativement. Ainsi, de nombreuses stratégies de PCR ont été mises au point pour cibler spécifiquement les combinaisons V-C des régions variables permettant une évaluation quantitative de leur usage (Matsutani et al., 1997; VanderBorght et al., 1999). Une autre approche fut d’utiliser des puces à ADN, supports de sondes ciblant par exemple les gènes

TRAV et/ou TRBV (Matsutani et al., 1997; Ogle et al., 2003). Alternativement et de manière plus qualitative, de nombreuses études ont eu recours à l’analyse de la diversité des transcrits TR par clonage bactérien et séquençage de Sanger (Moss and Bell, 1995; Moss et al., 1992; Rosenberg et al., 1992). Toutefois, ces techniques ne permettent pas une caractérisation globale de la diversité du répertoire. C’est pourquoi l’approche Immunoscope® (INSERM, Paris), aussi appelée spectratypage du CDR3, a été mise au point par l’équipe de Philippe Kourilsky au début des années 1990 (Cochet et al., 1992; Pannetier et al., 1993, 1995). Cette technique permet de décrire la diversité des répertoires lymphocytaires complets par l’analyse de la distribution des longueurs de la région hypervariable CDR3. Brièvement, les ARNm sont rétro-transcrits et amplifiés par des PCR en série ciblant les réarrangements V-C ou V-J puis séparés sur la base de la longueur des transcrits (Pannetier et al., 1993) générant ainsi pour chaque amplicon un spectratype (Figure 7). Chaque pic du spectratype représente une longueur de CDR3 mais peut correspondre à plusieurs séquences de CDR3 différentes. Dans des conditions physiologiques, la distribution de ces longueurs est visualisable par un profil de six à huit pics ayant l’allure d’une gaussienne caractérisant une réponse polyclonale (Pannetier et al., 1995). En cas de perturbation, un ou plusieurs pics prédominants seront le reflet de d’expansions monoclonales ou oligoclonales des lymphocytes.

Figure 7 : Exemples de profils des distributions de longueurs de CDR3 – (A) Profil de type gaussien

dans conditions physiologiques. (B) et (C) Profils perturbés reflétant respectivement une expansion oligoclonale ou monoclonale (d’après des résultats obtenus au sein du laboratoire dans le cadre du projet de neuropaludisme expérimental chez la souris).

L’étude du répertoire a subi des vagues successives d’engouement et de désintérêt. Le développement d’Immunoscope® a ouvert la voie à des études à plus grande échelle cherchant à identifier des expansions clonales en réponse à des peptides antigéniques particuliers (Bousso et al., 1999; Casrouge et al., 2000) ou à caractériser le développement lymphocytaire (Arstila et al., 1999; Regnault et al., 1994) mais aussi à évaluer la modulation de réponse immunitaire T en contexte pathologique (infectieux, tumoral…). Comme il en sera

discuté dans le prochain chapitre, les technologies de séquençage d’ADN ont connu de grands progrès depuis le début du XXIème siècle (Voelkerding et al., 2009) créant un nouvel engouement pour l’étude du répertoire T comme illustré Figure 8.

Figure 8 : Evolution du nombre de publications traitant du répertoire TCR de 1980 à nos jours

(Source: Pubmed)

En 2009, alors que Weinstein et al. produisaient une description à grande échelle du répertoire B des poissons zèbre, les équipes de Robins et de Holt cherchaient à évaluer la diversité du répertoire TCRβ chez l’homme (Freeman et al., 2009; Robins et al., 2009; Warren et al., 2009; Weinstein et al., 2009). La résolution de cette approche est telle qu’elle a permis à de nombreuses équipes de décrire de manière inédite des processus fondamentaux tels que la polarisation des lymphocytes T vers les différents compartiments cellulaires (Cebula et al., 2013; Föhse et al., 2011; Qi et al., 2014; Sherwood et al., 2011), les processus de diversification du TCR (Murugan et al., 2012; Srivastava and Robins, 2012) ou la similarité clonale interindividuelle (Prabakaran et al., 2012; Robins et al., 2010). Par ailleurs, de nombreuses études ont eu recours au séquençage à haut débit du répertoire TCR, dit RepSeq ou immunoséquençage, à des fins cliniques avec pour ambition d’identifier des biomarqueurs utilisables comme outils diagnostic (revue par Woodsworth et al., 2013).

En parallèle, du fait du niveau de détails, sans précédent, sur la composition du répertoire TCR, le RepSeq a engendré un besoin d'outils adaptés permettant d’extraire de manière exhaustive et standardisée l’information, et de caractériser la diversité de manière objective et facile à interpréter pour les immunologistes. Ainsi, de nouveaux champs de recherche se sont développés s’intéressant la modélisation informatique et statistique (Covacu et al., 2016; Murugan et al., 2012) ou à la caractérisation de la diversité du répertoire (Bolotin et al., 2013;

Brochet et al., 2008; Giraud et al., 2014; Plessy et al., 2015; Thomas et al., 2013b). Toutes ces approches ont leurs avantages et leurs inconvénients. Toutefois, comme décrit dans notre revue (Six et al., 2013) jointe en Annexe 5, chacune d’elles apporte un éclairage particulier sur ce même objet biologique ; à titre d’exemple, l’analyse par cytométrie en flux offre une description quantitative de la diversité du répertoire en l’abordant du point de vue de l’expression des grandes familles TRV, au niveau protéique à la surface du lymphocyte T, avec la limite de la disponibilité des anticorps monoclonaux. Le spectratypage du CDR3 permet de caractériser la diversité du répertoire d’un point de vue qualitatif en prenant en compte toutes les combinaisons TRVJ et la longueur de la jonction, en niveau des réarrangements génomiques ADN ou des transcrits correspondants. Ces deux exemples sont caractéristiques des niveaux de granularités étudiés en fonction des approches ; la pertinence de leur application va donc dépendre de la question biologique d’intérêt et les combiner permet d’obtenir des informations complémentaires, comme par exemple dans les études de Bergot et al. ou Wu et al. (Bergot et al., 2015; Wu et al., 2015).

D. Qu’est-ce que le séquençage à haut débit du TCR ?

1) Technologie

La méthode de Sanger, utilisée dans le cadre du Human Genome Project, a été considérée pendant plus de 30 ans comme un standard pour le séquençage. En 2005, fut lancée la première plate-forme de séquençage dit à haut-débit. Cette expression désigne un ensemble de méthodes parallèles permettant de séquencer simultanément des millions de fragments d’ADN. Ces méthodes, en s’affranchissant des étapes de clonage et de constitution de banques génomiques, permettent de réduire considérablement les temps et coûts de séquençage.

Les deux principales plates-formes de séquençage à haut débit (appelé NGS pour next generation sequencing ou HTS pour high-throughput sequencing) utilisées dans l’analyse de répertoire étaient Roche/454 et Illumina/MiSeq ou HiSeq (voir Metzker 2011 pour une revue complète).

La technologie de Roche/454 Life Sciences combine la PCR en émulsion (Tawfik and Griffiths, 1998) et le pyroséquençage (Nyren et al., 1993; Ronaghi et al., 1996, 1998) comme décrit

(400-700 paires de bases en moyenne) avec des performances variant en fonction des générations de séquenceurs entre 105 et 3.106 séquences par expérience de séquençage.

En 2006, Illumina fit l’acquisition d’une technologie de séquençage initialement conceptualisée par les fondateurs de Solexa. Cette technique combine l’amplification en phase solide et le séquençage par synthèse (mesure de fluorescence) (Figure 9B). Les séquences produites étant courtes (35-150 pb), le nombre de séquences par séquençage est bien plus élevé que celui des séquenceurs 454 : de 15.106 à plus de 3.109 en fonction des séquenceurs.

Figure 9 : Technologies de séquençage – A) Une « librairie » est préparée par ligature de fragments

ADN (300 à 800 paires de bases) avec des adaptateurs oligonucléotidiques ou par amplification avec des amorces incluant les adaptateurs. Les fragments ADN de la librairie sont ensuite dénaturés et individuellement liés via leur adaptateur à des billes. Chaque bille est ensuite isolée dans une microvésicule où a lieu la PCR en émulsion de la molécule d’ADN qu’elle porte. Après amplification, les billes ainsi recouvertes de millions de copies de leur fragment ADN d’origine sont ensuite distribuées sur une plaque recouverte de puits ne pouvant capturer qu’une seule bille. C’est au sein de ces puits que vont avoir lieu itérativement les réactions de pyroséquençage. B) Chaque fragment d’ADN de la librairie est dénaturé et fixé à un adaptateur puis immobilisé sur un support tapissé d’amorces complémentaires aux adaptateurs. Un brin complémentaire est synthétisé pour chaque fragment. Le nouvel ADN double-brin est dénaturé et chaque brin fixé forme alors un pont en s'hybridant localement avec l'amorce complémentaire de l'autre extrémité. Le brin complémentaire est synthétisé. L’opération est répétée un grand nombre de fois : il y a formation d’amas (cluster) du même fragment d’ADN. Ces clusters sont ensuite dénaturés et clivés. Le séquençage est initié avec l’addition d’amorces, d’une polymérase (POL) et d’un des 4 nucléotides « terminateurs réversibles » fluorescents (une couleur par base). Le signal de fluorescence est enregistré lors de l’incorporation

des nucléotides puis le « terminateur » est retiré avant le prochain cycle de synthèse. (Voelkerding et al., 2009)

En termes de précision, il apparaît que bien que son taux d’erreur global soit de l’ordre 1%, la technique de pyroséquençage de 454 montre des difficultés à gérer les longues (> 6) répétitions du même nucléotide (homopolymère), ce qui peut entraîner des insertions et des délétions. A l’inverse, même si le taux de délétions/insertions de la technologie Illumina est faible, son taux de substitution est plus élevé que celui de 454, de l’ordre de 3% (Bolotin et al., 2012; Mardis, 2011).

En 2012, Luo et al. ont comparé ces plates-formes dans le cadre de l’étude métagénomique d’une communauté planctonique d’eau douce. Ainsi, un échantillon d’ADN obtenu à partir d’un prélèvement fut divisé en deux aliquotes, l’un séquencé par le Roche 454 FLX Titanium et l’autre par Illumina Genome Analyzer II. Malgré les différences de protocoles, de longueur de séquences et surtout de nombre de séquences générées, les deux technologies semblent restituer une représentation similaire de la diversité de la communauté, avec un chevauchement d’environ 90% en termes d’espèces et une forte corrélation de leur abondances (R2>0.9) (Luo et al., 2012). Toutefois, une étude similaire, comparant le séquençage d’échantillons d’ARN par des séquenceurs Illumina et Ion Torrent – une troisième technologie NGS développée par Life technologies 2010, a démontré que le choix de la plate-forme de séquençage pouvait potentiellement biaiser l’évaluation de la diversité d’une communauté (Salipante et al., 2014).