• Aucun résultat trouvé

AUTRES APPLICATIONS

DONNÉES APPARIÉES

Le choix de travailler sur le jeu de données Treg nous donne l’opportunité d’appliquer la méthodologie mise en place au cours de cette thèse sur des données appariées. L’intérêt des données appariées est de pouvoir observer de manière plus fine l’impact de la variabilité inter-individuelle. J’ai donc procédé à la transformation des données d’expression des gènes des différents échantillons en données de variations des gènes de chaque donneur. La variation d’un gène est alors calculée sur la base du log2 du ratio d’abondance dans la condition traitée à l’IL-2 par rapport à la condition contrôle. Le sens de la variation n’ayant pas d’importance pour l’analyse, j’ai transformé les log-ratios en valeurs absolues de ces log-ratios. Nous obtenons alors des valeurs de variations de gènes exprimant à quel point un transcriptome change d’un traitement à l’autre. Pour un donneur, plus le nombre de gènes avec une forte variation sera grand, plus le donneur verra son transcriptome différent entre les deux conditions.

A B

Figure 50. Diversité des log-ratios du jeu de données Treg.

A : Diversité individuelle des différences d’expression du jeu de données Treg calculée pour 𝑞 = 1. B : Diversité individuelle des différences d’expression du jeu de données Treg calculée pour 𝑞 = 2.

118 La Figure 50 montre que pour les indices de Shannon et de Simpson, les valeurs de diversité individuelle des distributions de variation d’expression sont très différentes d’un donneur à l’autre. En revanche, la topographie des valeurs de diversité est identique pour les deux valeurs de 𝑞, indiquant une stabilité dans la variation entre 𝑞 = 1 et 𝑞 = 2. Il n’est pas question ici de faire une analyse de la similarité, puisque nous n’avons plus deux groupes à comparer. En revanche, nous pouvons apprécier le comportement de la diversité des variations d’expression chaque donneur pour différentes valeurs de 𝑞 (Figure 51). De manière intéressante, nous constatons que l’ordre des diversités sont très stables pour 𝑞 compris entre 0 et 2. Le donneur 1, par exemple est systématiquement plus divers que les autres donneurs. À l’inverse le donneur 3 est systématiquement moins divers que les autres donneurs. À partir de 𝑞 valant 3, les valeurs de diversité changent de comportement. Le donneur 1 devient alors l’un des donneurs avec la plus faible diversité. De la même manière que pour les analyses précédentes, plus nous montons dans les valeurs de 𝑞 , plus nous regardons la diversité des gènes possédant une forte variation d’expression entre les deux conditions, en minimisant l’impact des gènes ayant des variations d’expression faibles.

Figure 51. Diversité des log-ratio selon différentes valeurs de q.

119 On peut alors constater que les donneurs qui sont les moins divers pour les valeurs de 𝑞 élevées (donneurs 1, 3, 5, 6, et 9) sont aussi ceux qui voient leur spécialisation chuter le plus fortement entre les deux conditions (Figure 47). Les donneurs 2 et 8 ont aussi des différences de spécialisation entre les deux conditions mais ils sont, dans la condition non traitée, les deux donneurs avec les plus petites valeurs de spécialisation. Les donneurs 4 et 7 échappent à cette logique, puisque le donneur 4 montre une diminution forte de la spécialisation après le traitement à l’IL-2, tandis que le donneur 7 ne montre pas de diminution.

C’est finalement l’analyse de la spécialisation des variations d’expressions qui nous apprends peut-être le plus sur le comportement des donneurs. Cette mesure nous donne l’importance des fortes variations d’expression de transcrits qui sont spécifiques d’un donneur par rapport aux autres (Figure 52). Nous pouvons constater alors que le donneur 3 possède un nombre particulièrement important de tels transcrits par rapport aux autres donneurs.

Figure 52. Spécialisation des variations de gènes au sein du jeu de données Treg.

Valeurs de spécialisation des variations d’expression de gènes de chaque donneur, calculées sur la base des log-ratios d’expression entre les échantillons traités à l’IL-2 et les échantillons non traités.

On notera que les donneurs qui possèdent les valeurs de spécialisation les plus faibles (P4, P7 et P9) sont aussi ceux qui possèdent les valeurs de spécialisation les plus fortes dans la condition

120 traitée à l’IL-2 (Figure 47). Il y a presque une inversion des distributions des valeurs de spécialisation entre ces deux figures.

L’étude des gènes dont la variation d’expression est particulièrement spécifique d’un échantillon à l’autre par la méthode GSEA montre qu’une majorité des signatures enrichies sont issues de l’analyse ACI du jeu de données. L’analyse par ACI cherche les regroupements de gènes qui expliquent aux mieux la structure du jeu de données. Il apparaît donc plausible qu’un certain nombre de ces signatures soient directement liées aux variations d’expression du jeu de données. L’ordre des signatures ACI n’est pas le même en fonction des donneurs et on retrouve des différences dans les signatures enrichies pour les différents donneurs. Ainsi, les donneurs P1, P5 et P7 ont des profils de spécialisation enrichis pour des signatures du cycle cellulaire. Les donneurs P3, P7 et P9 partagent une signature liée à FOXP3 (« Ono_Foxp3_Target_Up ») où sont rassemblés des gènes dont l’expression augmente dans des cellules LTCD4 traitées pour augmenter l’expression de protéine FOXP3 par transduction. Cette signature n’est, pas du tout enrichie pour le donneur 1 (FDR q-value=0.57). Le donneur 4, quant à lui montre un enrichissement en signatures liées à la survie (« Hann_Resistance_To_Bcl2_Inhibitor_Dn ») et à l’inflammation (« Biocarta_Inflam_Pathway »). Le profil de donneur est par ailleurs, le seul à être enrichi pour une des deux signatures que j’ai obtenues à partir du jeu de données et qui contient les gènes trouvés statistiquement sur- ou sous-exprimés dans la condition traitée par rapport au contrôle : il s’agit de la signature des gènes sous-exprimés.

CLASSER LES TRANSCRITS

Documents relatifs