• Aucun résultat trouvé

Article 2: RNA binding disturbances as a continuum from Spinocerebellar ataxia type 2 to

3.3. Chapitre 3 : Mise en évidence de perturbations de l’épissage dans la maladie de

3.3.3. Discussion

Les résultats que nous avions obtenus au cours du chapitre 1 et du chapitre 2 nous avaient suggéré l’existence de défauts d’épissage dans la MP. Dans la présente étude, nous avons en effet identifié des variations d’expression de gènes et de transcrits liés à l’épissage entre les malades et les témoins. Ces changements d’expression sont présents à la fois chez des sujets présentant des formes génétiques de la maladie et chez des sujets sporadiques corroborant notre hypothèse selon laquelle les variations liées à l’épissage impacteraient un grand nombre de cas de la maladie. De plus, nos données montrent que ces perturbations de l’épissage n’impliquent pas uniquement des variations quantitatives mais concernent également de variations qualitatives par modifications de la composition en exons des transcrits. L’équipe de Shehadeh et ses collaborateurs ont également montré que les variations d’expression des facteurs d’épissage et en particulier du facteur SRRM2 étaient associées à des modifications qualitatives de l’épissage dans les cellules sanguines de parkinsoniens. Toutefois, nous n’avons pas retrouvé ces changements dans nos données. De façon intéressante, l’ensemble de ces modifications de l’épissage ont été observées à la fois chez des sujets à des stades précoces et des stades plus avancés de la maladie montrant que les perturbations de l’épissage sont présentes dès les stades précoces. Scherzer et ses collaborateurs avaient déjà suggéré que des modifications de l’épissage dans les cellules mononucléées périphériques sanguines de parkinsoniens avaient lieu chez les malades dès les premiers stades240. Toutefois, leur étude avait été menée à partir d’échantillons de 55 patients à un stade Hoehn et Yahr moyen égal à 2,3 ; stade au cours duquel les manifestations motrices sont d’ores et déjà visibles et ce de manière bilatérale. Ils ne témoignent donc pas des stades précoces de la maladie. En revanche, bien que nos effectifs soient moindres, les sujets aux stades précoces que nous avons étudiés ont un score Hoehn et Yahr moyen inférieur ou égal à 1,5 reflètant ainsi les perturbations moléculaires précoces. L’analyse d’Alieva et al. des processus biologiques liés aux gènes différentiellement exprimés dans les cellules sanguines de 4 patients de novo sans traitements et 4 témoins appariés a montré une association de 514 gènes avec l’épissage alternatif284 corroborant l’existance de perturbations de ce processus dès les premiers stades.

Bien que nos données soient préliminaires et aient été obtenues à partir de petits effectifs, elles nous ont permis de mettre en évidence de nombreuses variations à la fois quantitatives et qualitatives. Les données quantitatives d’expression génique ont révélé des variations de gènes et de transcrits impliqués dans la transduction du signal, la réponse immunitaire, la prolifération et la croissance cellulaire ainsi que la réponse au stress. Ces voies avaient déjà été observées dans nos données de puces de sujets porteurs de la mutation G2019S de LRRK2 et de cas sporadiques tendant

172 ainsi à valider l’existence de ces dérèglements dans les cellules sanguines de parkinsoniens. Des modifications d’expression génique liée à la transmission synaptique et à la réponse immunitaire ont aussi été observées dans le cerveau de parkinsoniens porteurs de la même mutation de LRRK2 ainsi que des sujets sporadiques242,227,279. L’ensemble de ces données souligne l’importance du système immunitaire dans la MP sachant que les gènes du système HLA font partie des gènes dérégulés dans le cerveau des parkinsoniens et que des polymorphismes de ces gènes sont associés à un risque accru de développer la maladie285,242. Il semblerait que des perturbations du système immunitaire soient présentes dès les stades précoces puisque nous avons observé des variations de gènes et transcrits impliqués dans ces processus chez les sujets de novo. Des variations d’expression de gènes liés à la réponse immunitaire ont été retrouvées par une autre équipe ayant étudié le transcriptome de cellules sanguines de 4 patients de novo versus les 4 témoins appariés suggérant l’implication du système immunitaire dès les premiers stades. Ces dérèglements de l’immunité ont également été retrouvés dans les cellules sanguines des sujets asymptomatiques porteurs de la mutation G2019S de

LRRK2244 et dans la substance noire de cas incidents à des stades de Braak entre 1 et 2 (lorsque la substance noire n’est pas encore atteinte) mimant ainsi les premiers stades de la maladie. Bien qu’étant menées sur de petits échantillons, les résultats de ces études convergent vers l’implication de perturbations du système immunitaire dès les premiers stades de la maladie. En nous intéressant à ces changements qualitatifs de l’épissage, nous avons observé que ces modifications de jonctions entre exons impactaient des voies et des processus connus pour être liés à la maladie, comme la « voie d’ubiquitination des protéines », les troubles mitochondriaux et l’immunité avec des perturbations de la « voie CTLA4 dans les lymphocytes T cytotoxiques ». Tout comme les variations quantitatives de gènes et de transcrits, ces jonctions nouvelles sont également observées dès les premiers stades et modifient également des jonctions entre exons de gènes impliqués dans la réponse immunitaire comme les gènes des immunoglobulines IGKV1-12, IGKV1-13, IGKV1-6,

IGHV3-52 ou des récepteurs aux immunoglobulines FCRL2 et FCRL5.

Au-delà des voies et processus classiquement énoncés comme étant liés à la maladie, les données de RNAseq ont montré des pertubations de voies précedemment identifiées dans nos données de puces d’expression à savoir des pertubations de la « voie de signalisation EIF2 », de la voie de « régulation de eiF4 et p70S6K » ou encore de la « voie PI3K/Akt ». Ceci a permis de révéler que ces voies étaient également modulées par des perturbations de l’epissage des gènes qu’elles contiennent suggérant que les possibles perturbations de la traduction et de l’épissage dans la MP puissent être la résultante des perturbations de ces voies. De façon intéressante, nos croisements des listes de gènes ayant des perturbations qualitatives de l’épissage avec la liste de gènes liés à la physiopathologie de la maladie (gènes à mutations causales ou avec des polymorphismes) ont

173 montré que ces défauts d’épissage impactent aussi des gènes liés à la maladie. Ce lien entre l’épissage et la MP est renforcé par l’observation de nouveaux épissages au sein des gènes ATXN2 et

PABP (ayant un lien probable avec la MP) qui méritent d’être étudiés afin de voir si des modifications

de l’épissage de ces gènes sont pathogènes. L’hypothèse selon laquelle les mutations causales ou les facteurs de risque de la MP puissent être associés à des variations de l’épissage est d’autant plus pertinente que des polymorphismes dans la région 3’ non traduite de l’ARNm de SNCA sont responsables d’une augmentation du ratio isoformes 112/140 dans le cerveau de parkinsoniens sporadiques286, de même que dans les lignées cellulaires dopaminergiques de neuroblastome SH-SY5Y et un modèle murin de la MP exposés à du MPTP275. Des délétions au niveau des sites d’épissage des gènes PINK1287 et DJ-1288 sont responsables de modifications de la structure des transcrits exprimés. D’autres gènes tels que LRRK2 et PRKN montrent une expression préférentielle de certains transcrits chez les parkinsoniens argumentant l’importance de l’épissage dans les processus physiopathologiques.

L’un des objectifs de ces études de RNAseq étaient de mettre en évidence les différents paramètres à prendre en compte pour l’emploi de cette méthode dans l’étude de l’épissage. L’un des facteurs pouvant influencer les résultats de RNAseq est le nombre de reads générés et alignés sur le génome de référence qui va définir la couverture de séquençage. La couverture correspond au nombre de gènes détectés par le RNAseq par rapport au nombre de gènes présents dans le génome de l’organisme étudié ; plus ce nombre est grand et plus la proportion de gènes et transcrits étudiés est importante, reflétant ainsi la réalité du transcriptome étudié. Des stratégies ont été développées pour évaluer la couverture qui serait suffisante pour obtenir des données de RNAseq fiables289. Dans notre cas, bien que le nombre de reads aient été supérieur dans l’étude pilote par rapport à l’analyse de faisabilité, la quantité de gènes et/ou de transcrits identifiés s’est avérée nettement inférieure par rapport à celle identifiée dans l’étude de faisabilité. Le changement du génome RefSeq pour le génome Ensembl pourrait être une explication à cette baisse. En effet, plusieurs bases des données d’annotations du génome humain sont actuellement disponibles incluant AceView Genes, Ensembl Genes, H-InvDB Genes, RefSeq Genes, UCSC Known Genes et Vega Genes. La principale différence entre ces bases de données est la quantité d’informations qu’elles contiennent. La base de données RefSeq semble être celle qui contient le moins d’informations mais qui présente l’avantage par rapport aux autres d’être une base de données non redondante ce qui facilite l’alignement des reads et donc l’identification des séquences auxquelles ces derniers correspondent. Po-Yen Wu et al. ont en effet montré, en comparant des données de séquençage de mêmes échantillons alignés sur des génomes différents, que l’annotation des reads était facilitée par la réduction de la complexité du génome de référence290. En effet, en contenant un nombre moins important de séquence, ceci réduit

174 la possibilité d’alignement des reads à plusieurs endroits dans le génome et donc la difficulté à déterminer la séquence dont ces reads sont issus. Nous avons en effet pu voir que le choix du génome de référece était déterminant puisque même si nos analyses sont effectuées sur des sujets différents nous nous attendions à obtenir quelques gènes communs ce qui n’a pas été le cas. En replaçant ceci dans le contexte d’une identification de biomarqueurs, il pourrait alors s’avérer difficile d’identifier une ou plusieurs cibles potentielles dont les variations pourraient être vérifiées chez différents groupes de sujets. Nous avons d’ailleurs rencontré ce problème puisque les gènes

RBM5 et CCLN1 pour lesquels nous avons validé la surexpression de transcrits possédant de

nouvelles jonctions, n’a pas été retrouvée dans nos différentes analyses. La nécessité de recourir à une méthode standardisée est plus qu’indispensable à la vue de notre objectif qui vise à maximiser les chances de découvrir des cibles potentielles fiables.

175