Discussion et perspectives - Identification des modifications post-traductionnelles d'Ilf

Ilf3 et NF90, deux protéines de liaison aux ARN localement structurés en double brin, sont générées par épissage mutuellement exclusif à partir d’un même gène ILF3. Leurs ARN messagers subissent un épissage alternatif complémentaire à l’origine de la synthèse de deux isoformes protéiques, une longue et une courte, qui diffèrent par la présence ou non d’une séquence de treize acides aminés à leur extrémité N-‐terminale. En plus de ces modifications post-‐transcriptionnelles, Ilf3 et NF90 sont l’objet de modifications post-‐traductionnelles comme des méthylations et des phosphorylations. Toutes ces modifications sont à l’origine d’une forte hétérogénéité de ces deux protéines présentant au moins vingt isoformes, douze pour Ilf3 et huit pour NF90. Etant impliquées dans des fonctions mettant en jeu des ARN et des protéines, le polymorphisme d’Ilf3 et de NF90 est, au moins pour une partie, à l’origine de leurs différentes localisations subcellulaires et, en fonction des interactions établies avec leurs partenaires protéiques et/ou nucléiques, leur confère différents rôles biologiques.

Par fractionnement subcellulaire de cellules HeLa en culture, la localisation de toutes les isoformes des protéines Ilf3 et de NF90 a été déterminée (Viranaïcken et al., 2011). Ces expériences ont montré que les formes courtes et longues d’Ilf3 sont présentes dans le cytoplasme et le noyau, dont le nucléoplasme (Figure 30, page 63). Par contre, seules les isoformes longues les plus basiques sont localisées dans le nucléole. De même, bien que les deux formes de NF90 soient présentes dans le cytoplasme, seule la forme longue est retrouvée dans le noyau et exclusivement au niveau du nucléole (Viranaïcken et al., 2011). Cette différence de localisation nucléolaire entre les formes longues et courtes s’explique, d’une part, par la présence ou non de la courte séquence N-‐terminale (ALYHHHFITRRRR) correspondant à un signal de localisation nucléolaire (NoLS) (Viranaïcken et al., 2011) et, d’autre part, par la présence de modification(s) post-‐ traductionnelle(s) qui acidifie plus ou moins le point isoélectrique des protéines.

Cependant, la présence d’un NoLS dans la séquence d’une protéine n’est pas requise pour observer sa localisation dans le nucléole. En effet, il a récemment été montré qu’au niveau des nucléoles, des ARN non codants étaient capables de capturer et d’immobiliser des protéines qui possèdent un petit peptide nommé séquence de

détention nucléolaire (Audas et al., 2012). Il a également été montré que les protéines nucléolaires s’associent et se dissocient rapidement des autres composants nucléolaires, permettant des échanges continus entre les deux nucléoles voisins (Kiebler et al., 2005) ou entre le nucléole et le nucléoplasme (Phair and Misteli, 2000), ou bien encore diffusent librement dans l’espace nucléaire (Raska et al., 2006).

La plupart des protéines nucléolaires ne demeurent que quelques dizaines de secondes dans le nucléole. Dans ce cas, elles ne sont pas recrutées par un mécanisme de transport actif au nucléole grâce à un NoLS mais plutôt par un mécanisme d'interaction entre le NoLS et d'autres macromolécules déjà présentes dans le nucléole. Par exemple, dans le cas de la nucléoline qui est une protéine possédant un NoLS, elle ne peut pénétrer dans le nucléole qu’en se combinant soit avec de l’ARN via son domaine RRM (« Recognition RNA Motif »), soit avec une autre protéine nucléolaire (Li et al., 1996). Il en est de même pour la protéine Rex, protéine homologue de Rev, du rétrovirus humain HTLV-‐1 qui entre dans le nucléole en se combinant avec la protéine nucléolaire B23 (Adachi et al., 1993) qui appartient au groupe de protéines faisant la navette entre le noyau et le cytoplasme. Ainsi, des interactions entre protéines peuvent avoir un effet direct sur leur localisation subcellulaire.

Pour revenir à l’expérience de fractionnement subcellulaire des protéines Ilf3 et NF90, cette dernière a permis de déterminer la localisation cytoplasmique et/ou nucléaire de leurs vingt isoformes. De plus, dans la littérature, il a été montré que ces deux protéines pouvaient être méthylées et phosphorylées. Effectivement, au laboratoire, des traitements d’extraits protéiques par la phosphatase alcaline ou de cellules en culture par l’adoxycycline, un inhibiteur des méthyltransférases, ont révélé la présence de formes phosphorylées et/ou méthylées d’Ilf3 et de NF90, acidifiant plus ou moins le point isoélectrique de ces protéines selon la modification considérée (Viranaïcken, 2005). Par conséquent, pendant ma thèse, j’ai caractérisé certaines modifications post-‐ traductionnelles de ces deux protéines. La combinaison d’expériences d’immunoprécipitation et d’analyses par spectrométrie de masse a permis de mettre en évidence la diméthylation asymétrique de l’arginine 609/622 contenue dans un motif RGG, la phosphorylation de la sérine 190/203 et une acétylation de l’acide aminé à l’extrémité N-‐terminale de l’isoforme longue d’Ilf3 après hydrolyse de la méthionine initiatrice.

Concernant cette dernière modification post-‐traductionnelle, il a été montré que, dans 80% à 90% des cas, les protéines eucaryotes sont acétylées en N-‐terminal (Polevoda et Sherman, 2000). Dans plus de 50% à 60% de ces dernières, le groupement acétyle a été ajouté sur le groupement amine, non pas de la méthionine initiatrice, mais sur celui du résidu d’acide aminé désormais en position N-‐terminale, après l’hydrolyse co-‐ ou post-‐ traductionnelle de la méthionine lors d’une réaction catalysée par une méthionine aminopeptidase (Polevoda et Sherman, 2000). Après hydrolyse de la méthionine initiatrice, la protéine Ilf3-‐L possède à son extrémité N-‐terminale une alanine. Si la protéine Ilf3-‐C subissait les mêmes modifications, celle-‐ci possèderait en position 1 une arginine. Selon la nature de l’acide aminé en position N-‐terminale, il a été montré que la demi-‐vie d’une même protéine peut plus ou moins varier (Varshavsky, 1997). Une alanine en position 1 entraîne ainsi un accroissement de la stabilité d’un facteur d’environ 4 par rapport à une arginine. De plus, la stabilité de ces deux isoformes pourrait varier selon qu’il y ait eu ou non hydrolyse de la méthionine initiatrice.

D’une manière plus générale, la présence d’une acétylation du résidu N-‐terminal ne semble pas être lié à la stabilité des protéines. Cependant, sa fonction précise n’a toujours pas été déterminée contrairement au cas de plusieurs hormones comme, par exemple, la β-‐endorphine (Millington et al., 1986) ou la « α-‐melanocyte stimuling hormone » (Guo et al., 2004) pour lesquelles l’acétylation à l’extrémité N-‐terminale régule positivement ou négativement leur activité.

Par conséquent, par la suite, mon travail de thèse s’est principalement porté sur deux des modifications post-‐traductionnelles identifiées, c’est-‐à-‐dire la diméthylation de l’arginine 609/622 et la phosphorylation de la sérine 190/203.

Dans la littérature, la diméthylation de l’arginine 609/622 a été décrite lors d’étude de protéomique à grande échelle mettant en jeu diverses approches expérimentales comme, par exemple, le SILAC (« stable isotope labeling by amino acids in cell culture »). En effet, elle a été identifiée dans des cellules HeLa parmi 59 sites de méthylation d’arginine mis en évidence par cette méthode (Ong et al., 2004) ainsi que parmi 249 sites de méthylation d’arginine identifiés dans 131 protéines de cellules humaines lymphocytaires (CD4) (Uhlmann et al., 2012). Ces travaux ont donc permis de caractériser une diméthylation d’arginine dans les protéines Ilf3 et NF90 mais elle n’a

été retrouvée qu’à peu de reprises lors de ces analyses globales et aucune étude fonctionnelle plus approfondie n’a été entreprise.

De plus, des expériences de western blot, après séparation par électrophorèse bidimensionnelle d’extraits protéiques de cerveaux de souris, utilisant l’anticorps Asym24 pour détecter les isoformes méthylées ont permis de constater qu’Ilf3 et NF90 présentent des isoformes méthylées et plus particulièrement que NF90 est très faiblement méthylées comparé à Ilf3 (Figure 29, page 62).

Pour la première fois, au laboratoire, cette modification post-‐traductionnelle a été mise en évidence dans les protéines Ilf3 et NF90 endogènes purifiées et est présente dans un motif RGG, séquence consensus pour l’enzyme de diméthylation asymétrique PRMT1 (« Protein arginine N-‐methyltransferase 1 ») (Tang et al., 2000). Toutefois, cette séquence est localisée en dehors du domaine riche en arginine et en glycine prédit lors de la recherche de motifs canoniques. Il était donc envisageable de rechercher un ou plusieurs autres sites de diméthylation dans ce domaine RGG mais les nombreuses analyses de spectrométrie de masse effectuées n’en ont révélé aucun. De plus, nous avons constaté que l’arginine 609/622 est plus fréquemment diméthylée dans la protéine Ilf3 que dans le facteur NF90. Cette différence serait due à une moindre liaison de PRMT1 sur la région C-‐terminale de NF90. En effet, Tang et ses collaborateurs ont montré qu’Ilf3 est méthylée lors d’une réaction catalysée par PRMT1 dans une séquence consensus de type RGG, contrairement à NF90 et, plus particulièrement, que le domaine C-‐terminal d’Ilf3 de 210 acides aminés est responsable de l’interaction entre ces deux protéines et de sa méthylation d’arginine (Tang et al., 2000). Pourtant, NF90 présente, tout comme Ilf3, le domaine riche en arginine et en glycine, mais cette protéine possède une région C-‐terminale de 15 acides aminés qui, de par sa courte taille, pourrait ne pas favoriser son interaction avec PRMT1 et donc sa méthylation. C’est pourquoi, NF90 serait moins fréquemment méthylée qu’Ilf3.

Néanmoins, une autre possibilité pourrait être envisageable. En effet, NF90 pourrait être méthylée lors d’une réaction catalysée par PRMT1 et médiée par l’intermédiaire d’une autre protéine mais cela n’a jamais été démontré.

Dans les banques de données, par exemple « Uniprot », treize modifications post-‐ traductionnelles potentielles ont été prédites au sein des protéines Ilf3 et NF90 humaines, huit phosphorylations sur des sérines et trois sur des thréonines, dont deux catalysées par la kinase PKR, ainsi que deux acétylations sur des lysines. La phosphorylation sur la sérine 190/203 a été mise en évidence dans le cadre de caractérisation de phosphoprotéome mitotique par spectrométrie de masse (Tableau 4, page 98) (Dephoure et al., 2008 ; Olsen et al., 2010 ; Rigbolt et al., 2011).

Comme pour la diméthylation de l’arginine 609/622, la phosphorylation de la sérine 190/203 a été identifiée au laboratoire dans les protéines Ilf3 et NF90 endogènes purifiées. Elle a été retrouvée plusieurs fois au cours de diverses expériences indépendantes et non une seule fois comme c’est le cas dans les analyses de phosphoprotéome trouvées dans la littérature. C’est pourquoi ces deux modifications post-‐traductionnelles ont fait l’objet de mon travail de thèse.

Cependant, lors des différentes analyses de spectrométrie de masse effectuées lors de ma thèse ayant pour but de caractériser des modifications post-‐traductionnelles d’Ilf3 et de NF90, une dizaine d’autres sites de phosphorylation ont été mis en évidence à une seule reprise.

Parmi ces divers sites, la phosphorylation de la sérine 482 a déjà fait l’objet d’une étude montrant que cette modification post-‐traductionnelle, probablement catalysée par la kinase mitotique PLK1, est importante pour la stabilité de NF90 et pour la régulation de son rôle fonctionnel durant la mitose (Smith et Miskimins, 2011).

De plus, tous les sites de phosphorylation n’ont peut-‐être pas été retrouvés lors des analyses de spectrométrie de masse effectuées. Par exemple, la phosphorylation de NF90 sur la sérine 647, observée dans les cellules lymphocytaires T, n’a pas été décelée. Cette modification est impliquée dans l’export nucléaire de NF90 et la stabilisation de l’ARN messager IL-‐2 par NF90. Cette modification post-‐traductionnelle peut apparemment être catalysée par deux kinases, AKT (Pei et al., 2008) ou PKC (Zhu et al., 2010).

Quant aux autres sites de phosphorylation identifiés une fois uniquement au laboratoire (Tableau 5, page 101), certains d’entre eux sont retrouvés parmi les sites de phosphorylations déterminés dans des analyses de phosphoprotéomes (Tableau 4, page 98) mais aucune étude approfondie sur leur(s) rôle(s) potentiel(s) n’a été entreprise pour le moment.

La phosphorylation étant une modification post-‐traductionnelle très fréquente et très étudiée au sein de la cellule, la présence de ces modifications supplémentaires au niveau des protéines Ilf3 et NF90 devrait être vérifiée par des expériences supplémentaires. Par exemple, il serait intéressant de déterminer celle(s) liée(s) à la mitose du cycle cellulaire, comme cela a été décrit dans les études de phosphoprotéome mitotique, et également celles tissu-‐dépendant, type cellulaire-‐dépendant et lignée-‐dépendante.

L’étude de la caractérisation des modifications post-‐traductionnelles devra donc être poursuivie afin de confirmer celles succinctement décrites dans la littérature et de s’assurer qu’il n’en existe pas d’autres encore inconnues (acétylation, phosphorylation, méthylation, glycosylation, isoprénylation, ubiquitinylation, …).

Comme cela a été présenté précédemment, les protéines Ilf3 et NF90 ont des localisations subcellulaires variables selon la présence ou non de la séquence de treize acides aminés à leur extrémité N-‐terminale. De plus, une analyse par électrophorèse bidimensionnelle des vingts isoformes protéiques d’Ilf3 et de NF90 provenant d’un fractionnement subcellulaire de cellules HeLa en culture a permis de montrer que :

-‐ les isoformes courtes de NF90 sont présentes dans le cytoplasme,

-‐ les isoformes longues de NF90 sont localisées dans le cytoplasme et le nucléole, -‐ les isoformes courtes d’Ilf3 sont présentes dans le cytoplasme et le

nucléoplasme,

-‐ seules les isoformes longues d’Ilf3 les plus basiques sont présentes dans le nucléole.

Ceci peut s’expliquer par le fait que, par exemple, NF90, formes courte ou longue, est phosphorylée lors d’une réaction catalysée par la kinase PKR présente dans le cytoplasme et le noyau et que NF90, une fois phosphorylée dans le cytoplasme, reste dans ce compartiment pour les isoformes courtes et peut y rester ou être transférée dans le nucléole pour les formes longues. Il en est de même avec Ilf3 qui peut être phosphorylée, mais également méthylée lors d’une réaction catalysée par PRMT1 dans le cytoplasme. Dans ce cas, les isoformes courtes ou longues modifiées restent dans ce compartiment et, si elles sont en plus phosphorylées, sont localisées à la fois dans le cytoplasme et le noyau.

Comme cela a été précédemment exposé dans l’introduction, des protéines de liaison aux ARN telles que hnRNP Q et hnRNP K méthylées sur leur motif RGG, sont relocalisées dans le cytoplasme (Passos et al., 2006 ; Chang et al., 2011) alors que la protéine SERBP1 (« Serpine m-‐RNA binding protein 1 »), également méthylée sur un motif RGG, est quant à elle importée dans le noyau (Lee et al., 2012).

Ainsi, j’ai testé si la diméthylation de l’arginine 609/622 et la phosphorylation de la sérine 190/203 pouvaient être impliquées dans ce processus de transport nucléocytoplasmique. Pour cela, des expériences d’immunofluorescence avec les protéines sauvages et mutées sur les sites de diméthylation et de phosphorylation ont été effectuées.

Les protéines Ilf3 et NF90 délétées pour le motif RGG ou mutées sur l’arginine diméthylable se localisent de manière similaire avec la forme sauvage. Comme aucune différence avec les résultats obtenus avec les protéines sauvages n'a été observée, ces deux modifications post-‐traductionnelles ne semblent donc pas être impliquées dans une redistribution nucléocytoplasmique d’Ilf3 et de NF90.

Un tel résultat a déjà été décrit dans la littérature. En effet, il a été montré récemment, qu’une diméthylation d’arginine présente dans un motif RGG n’est pas toujours impliquée dans ce processus de distribution nucléocytoplasmique, surtout quand le résidu modifié est localisé en dehors du domaine riche en arginine et en glycine de la protéine. C’est le cas par exemple de la protéine hnRNP A2 qui possède un long motif RGG (R191 à G253) pouvant être méthylé et impliqué dans la localisation nucléaire de la protéine (Nichols et al., 2000) mais qui a également été montré comme pouvant être diméthylée sur un site unique, l’arginine 254, située à l’extrémité du domaine RGG et qui n’a pas d’effet sur sa distribution nucléocytoplasmique (Friend et al., 2013).

Après avoir travaillé sur la localisation subcellulaire des protéines Ilf3 et NF90 ayant subi une de ces modifications post-‐traductionnelles, diméthylation de l’arginine 609/622 ou phosphorylation de la sérine 190/203, l’étude du rôle de ces modifications dans la régulation des interactions avec les partenaires protéiques d’Ilf3 et de NF90 a été entreprise.

Le nucléole étant le lieu où se déroulent les premières étapes de la biosynthèse des ribosomes, Ilf3 et NF90 pourraient intervenir lors de la synthèse et la maturation des ARN ribosomiques ainsi que dans l’assemblage des particules pré-‐ribosomales. De plus, dans la littérature, il a été montré qu’Ilf3 et NF90 sont impliquées dans un grand nombre de processus cellulaires. En effet, des études d’invalidation du gène Ilf3 et de surexpression de NF90 chez la souris ont permis de constater que ces deux protéines jouent un rôle dans la stabilisation des ARN messagers et des protéines ainsi que dans la régulation de la traduction (Shi et al., 2005 ; Higuchi et al., 2012). De plus, toutes deux interagissent avec de nombreux ARN, comme par exemple les ARN messagers, via leurs domaines de liaison aux ARN suggérant une fonction dans l’export nucléaire, le transport et/ou la localisation intracytoplasmique des ARN. Cependant, la plupart des partenaires protéiques d’Ilf3 et de NF90 déjà connus n’est pas impliqué dans ces processus. Cela signifie que d’autres protéines doivent interagir avec Ilf3 et NF90 afin de pouvoir assurer leurs fonctions. Pour cela, des études de protéomique ont été réalisées au laboratoire et ont permis d’identifier six nouveaux partenaires (Chaumet et al., 2013). Parmi ces six protéines, cinq sont des protéines de liaison aux ARN (hnRNP A/B, hnRNP A2, hnRNP A3, hnRNP D et hnRNP Q) et la sixième un facteur d’épissage, PSF. Elles sont donc toutes impliquées dans le métabolisme des ARN à divers niveaux : l’épissage, la stabilisation et le transport d’ARN.

Les protéines hnRNP A2, hnRNP A3, hnRNP Q et PSF, ainsi que l’enzyme de diméthylation PRMT1, fusionnées à la GST, ont donc été utilisées dans des expériences de « GST pull-‐down » pour étudier l’effet des modifications post-‐traductionnelles sur leur interaction avec les protéines Ilf3 et NF90 sauvages ou mutées sur l’arginine 609/622 ou sur la sérine 190/203.

Comme les hnRNP, Ilf3 et NF90 sont des protéines de liaison aux ARN localement structurés en double brin. Des ARN peuvent alors être requis dans l’établissement des interactions entre Ilf3 et/ou NF90 et leurs partenaires protéiques. Afin de vérifier si ces interactions sont dépendantes ou non de la présence d’ARN, les expériences de « GST pull-‐down » ont été réalisées en présence ou en absence de ribonucléase A.

Nous avons pu constater la présence d’une interaction potentielle avec les protéines sauvages ou mutées et la GST seule dans le témoin négatif. Cela étant très étonnant, différentes modifications du protocole ont été testées sans qu’aucun changement ne soit observé. En effet, une expérience de « GST pull-‐down » a été réalisée avec la protéine Ilf3 en présence de ribonucléase A mais sans aucun partenaire. Le résultat obtenu montre que les protéines sont présentes dans le culot, ce qui est dû soit à l’interaction avec un ARN non hydrolysé par la ribonucléase A qui agit spécifiquement sur les ARN simple-‐ brin, soit au fait qu’Ilf3 ne soit pas complètement soluble, soit à une interaction non spécifique avec la ribonucléase A conduisant à une insolubilité du complexe.

Néanmoins, au vu de l’ensemble des résultats, aucune différence entre ceux obtenus avec les protéines mutées et les protéines sauvages n'a été observée. Il semble donc que ni la diméthylation de l’arginine 609/622, ni la phosphorylation de la sérine 190/203 ne soient impliquées dans une fonction de régulation des interactions d’Ilf3 et de NF90 avec leurs partenaires protéiques testés.

Cependant, des expériences complémentaires, comme des co-‐immunoprécipitations et/ou de la résonance plasmonique de surface, sont nécessaires afin de confirmer les diverses interactions observées entre les protéines mutées et les différents partenaires, ainsi que de déterminer l’affinité de ces partenaires d’interaction pour les protéines Ilf3 et NF90 mutées.

De plus, dans ces expériences, cinq partenaires seulement ont été testés mais il en existe beaucoup d’autres décrits dans la littérature (Figure 49, page 120) comme par exemple FUS, SMN, NF45, … qui pourraient être testés dans des expériences de « GST pull-‐down » afin de déterminer si les modifications post-‐traductionnelles mises en évidence pour les protéines Ilf3 et NF90 sont impliquées dans la régulation de leurs interactions avec ces autres partenaires. Ces derniers subissent également des modifications post-‐ traductionnelles qui pourraient jouer un rôle dans leurs interactions avec Ilf3 et NF90. Ainsi, des expériences de co-‐immunoprécipitation avec les partenaires exprimés en système hétérologue ou issus de cellules HeLa en culture sont également à réaliser afin

Dans le document Identification des modifications post-traductionnelles d'Ilf3 (Interleukin enhancer binding factor 3) et de NF90 (Nuclear Factor 90) et étude de leur rôle(s) fonctionnel(s) (Page 155-167)