• Aucun résultat trouvé

MODELISATION DE LA DIVERSITE DU REPERTOIRE TR

2) Topologie TRBVBJ des répertoires

À l’instar des analyses de cytométrie en flux et de spectratype du CDR3, l’analyse de la distribution d’usage et d’expression des gènes TRBV et TRBJ est très informative sur les différences de structure des répertoires comparés. Ainsi, une réponse immunitaire, en fonction de l’antigène (plus précisément du peptide antigénique) qui l’a induite, peut entraîner éventuellement la surreprésentation d’une ou plusieurs combinaisons BVBJ ou une famille de BV particulière par exemple. Ainsi, l’indice de similarité MH sur les fréquences

d’usages BVBJ est utilisé comme indicateur de la structure des populations et permet leur classification hiérarchique sur ce critère.

Figure 29 : Classification hiérarchique des 28 répertoires TRB en fonction de leur similarité en termes de distribution TRBVBJ – L’indice de similarité MH est calculé entre tous les échantillons 2 à

2. Chaque cellule de cette matrice indique la valeur de similarité entre une paire d’échantillons. Les échantillons sont identifiés par une couleur différente en fonction de leur organe (en ligne) et leur population (en colonne). Dendrogramme : distance euclidienne et méthode « complete ».

Lorsque l’on évalue la similarité entre le répertoire TRB de nos 28 échantillons sur la base de leur expression des combinaisons BVBJ (Figure 29), on observe deux clusters prédominants séparant le répertoire des échantillons CD8+ de celui des trois populations CD4+. Cette observation est identique lorsque l’on prend en compte la diversité d’usage des gènes TRBV. Cette observation est en accord avec l’hypothèse selon laquelle la diversité des répertoires TRB des LT CD8+ et CD4+ est forgée par leur interaction avec les molécules du CMH (Pannetier

et al., 1993). En effet, l’interaction avec le CMH lors de la reconnaissance antigénique est, entre autres, conditionnée par les régions CDR1 et CDR2 de la chaîne β du TCR, inclus dans la région codée par le gène TRBV. Ainsi, la différence de composition TRBV des répertoires de ces populations est liée au fait que les LT CD4+ et CD8+ interagissent avec des classes de CMH différentes.

Une autre approche consiste à calculer l’indice de Shannon exp(H) calculé au sein de chaque combinaison TRBVBJ et de projeter les valeurs des échantillons par analyse en composantes principales (Figure 30).

Figure 30 : Projection ACP des 28 échantillons en fonction de leur population cellulaire sur la base de leur diversité clonotypique au sein de chaque combinaison TRBVBJ – Pour chaque répertoire,

l’exponentielle de l’indice de Shannon exp(H) est calculée en prenant en compte les fréquences relatives des clonotypes catégorisés en fonction de leur expression des gènes TRBV et BJ, puis pondérée par la fréquence de chaque combinaison. Les échantillons sont projetés en fonction des deux premières composantes obtenues en analyse par composante principale (ACP) qui, combinées, expliquent 66% de la variabilité globale.

Cette analyse confirme que le répertoire CD8 est distant des trois populations LT CD4+, cette séparation se fait le long de la seconde composante (PC2). De plus, il apparaît que la première composante (PC1) tend à séparer les deux populations Tregs de la population Teff de part et autre de l’axe PC2, suggérant ainsi leur différence de diversité.

Comme évoqué plus tôt, la force des données d’immunoséquençage réside dans la possibilité de leur catégorisation de manières très différentes. Ainsi, on peut reconstruire les profils

spectratypiques de chacun des jeux de données en catégorisant les CDR3 des clonotypes

exprimant le même gène TRBV en fonction de leur longueur et calculant les fréquences de ces longueurs au sein de chaque famille TRBV. Il devient alors possible d’appliquer les approches d’analyses développées pour comparer ces distributions telles que le score de perturbation

ISEApeaks (Bergot et al., 2015; Collette and Six, 2002; Collette et al., 2003; Mariotti-Ferrandiz

et al., 2016; Petrovc Berglund et al., 2008). Ce score permet d’évaluer la distance de chaque échantillon par rapport à un échantillon de référence sur la base de la distribution des longueurs de CDR3 au sein de chaque famille TRBV. Si l’on considère par exemple la population Teff comme population de référence, un profil moyen à travers tous les échantillons correspondant est simulé pour chaque famille TRBV ; chacun des échantillons analysés est alors comparé à cette référence et un score de perturbation est calculé famille par famille. Cette technique permet d’évaluer le niveau de proximité entre les échantillons sur la simple distribution de taille des CDR3. Une analyse en composante principale (ACP) appliquée sur ces valeurs (Figure 31A) permet de visualiser la ségrégation des populations et confirme ici l’isolement des LT CD8+ par rapport aux CD4+ observé avec la diversité clonotypique. Cette approche permet, dans le cas du jeu de données utilisé, de mettre en évidence la variabilité des différentes populations en fonction de leur origine tissulaire. Par exemple, on observe que le répertoire des nTregs est différent dans les ganglions mésentériques par rapport aux autres organes observés et que le répertoire Teff est homogène dans les ganglions mais plus distant dans la rate. Par ailleurs, la classification hiérarchique obtenue sur la base des scores de perturbations des TRBV (Figure 31B) permet d’évaluer la distance entre les différentes populations. On note ici notamment que les profils de longueur de CDR3 des échantillons Teff sont plus proches de ceux des CD8 que des deux populations Tregs évoquant un niveau de polyclonalité/diversité plus élevé que celui des répertoires Tregs.

Figure 31 : Analyse de la diversité des spectratypes de CDR3 par TRBV.

A) Projection ACP des 28 échantillons sur la base de leurs profils spectratypiques. Les

échantillons sont colorés en fonction de leur population cellulaire (vert : Teff, orange : CD8, cyan : nTregs et bleu : amTregs) et regroupés en fonction du niveau anatomique de leur organe d’origine : rate (SPL), ganglions profonds (Deep), superficiels (Superficial) et mésentériques (MLN).

B) Classification hiérarchique des 28 répertoires TRB en fonction de leurs scores de perturbation. Les échantillons

(en colonne) sont identifiés en fonction de leur population, leur organe et leur niveau anatomique comme indiqué par la légende. Chaque cellule indique la valeur de leur score de perturbation par TRBV (en ligne). Dendrogramme : distance euclidienne et méthode « complete ».