• Aucun résultat trouvé

Chapitre 1. Caractérisation de l’ARN Tuna

2. Résultats

2.1. Tuna est conservé chez les vertébrés sur des régions spécifiques

Les précédents travaux d’identification et de caractérisation de Tuna mentionnent sa conservation au cours de l’évolution chez les vertébrés et mettent en avant une région particulière d’environ 200 nucléotides conservée en séquence, qui semble être liée à sa fonction49,73. En visualisant

la conservation de Tuna par les données PhyloP chez les vertébrés sur le site UCSC, nous avons identifié 4 régions conservées en séquence dans les différents exons de Tuna (Figure 7.A). La région conservée précédemment identifiée a été nommée CR1 pour « Conserved Region #1 », les deux autres régions conservées présentes dans le même exon : CR2 et CR3, et la dernière région conservée présente à l’extrémité 5’ de l’ARN, à cheval entre les exons 1 et 2 : CR4.

Les régions CR2 et CR3 correspondent respectivement à 2 signaux de polyadénylation (Poly(A)), suggérant deux sites de terminaison de la transcription distincts. Cette observation soulève l’hypothèse selon laquelle Tuna serait exprimé sous différentes isoformes dont l’extrémité 3’ serait tronquée lorsque le premier signal Poly(A) est choisi.

2.2. Tuna est exprimé sous différentes isoformes dépendamment de l’état cellulaire

Afin de vérifier l’existence éventuelle de différentes isoformes de Tuna, nous avons tout d’abord analysé des données de séquençage d’ARN75 (RNA-Seq) dans les différents types cellulaires

dans lesquels Tuna est exprimé : les mESCs et pendant la différenciation neuronale (Figure 7.A). L’alignement des produits de séquençage sur la séquence génomique de Tuna a révélé l’existence d’une différence de longueur des transcrits en fonction de l’état cellulaire. En effet, la densité de lectures de séquençage baisse drastiquement après le premier signal Poly(A) -CR2- dans les mESCs contrairement à la différenciation neuronale dans laquelle les lectures de séquençage sont présentes jusqu’à la fin du gène, où se retrouve le second signal Poly(A) -CR3. Ceci indique bel et bien l’existence de différentes isoformes de Tuna, une courte, sht.Tuna (short Tuna), de 1250nt et une longue, full.Tuna de 3000nt. Ce résultat, puisqu’encore jamais démontré, entraine une potentielle

divergence avec les résultats précédemment publiés, c’est pourquoi il est essentiel d’investiguer sur les éventuels différents rôles de ces nouveaux transcrits de Tuna.

Par la suite, nous avons réalisé une analyse de l’expression des différentes isoformes de Tuna par RT- qPCR au court de la différenciation neuronale des mESCs. Pour ce faire, l’ARN extrait à partir de culots secs de cellules à différents moments de la différenciation ont subis une rétrotranscription (RT) afin de générer l’ADNc correspondant. L’ADNc de Tuna est ensuite détecté par 2 jeux d’amorces « Total Tuna » et « full.Tuna », le premier détectant la totalité des transcrits de Tuna (situé dans la région CR1 commune à toutes les isoformes) et de le second uniquement l’isoforme neuronale full.Tuna (situé dans sa région 3’ exclusive). Parce que sht.Tuna partage l’intégralité de sa séquence avec full.Tuna, il n’a pas été possible de produire un jeu d’amorces spécifiques à sht.Tuna. Ces résultats montrent que l’isoforme full.Tuna n’est pas exprimée dans les mESCs mais uniquement lors du processus de différenciation neuronale avec un pic d’expression à jour 12, où les cellules ont atteint le phénotype neuronal (Figure 11.B). De plus, l’amplification observée avec le jeu d’amorce « Total Tuna » dans les mESCs montre que Tuna est bien exprimé dans ce type cellulaire. Ceci indique qu’à l’état pluripotent, les cellules expriment l’isoforme courte de Tuna, corroborant ce qui est observé grâce aux données de RNA-Seq et rationalise la présence des deux signaux Poly(A).

Finalement, les mêmes données de séquençage ont également mis en lumière une particularité au niveau de la région CR4, à l’extrémité 5’ de Tuna. L’analyse des lectures à la jonction de l’exon 1 et de l’exon 2 révèle la présence d’un potentiel épissage alternatif de l’exon 1 matérialisé par l’ajout de 36nt en 3’. La quantification de la proportion des lectures correspondantes à cet épissage par rapport à l’ensemble des lectures à cette jonction exon-exon montre que cet épissage n’a lieu que dans les cellules pluripotentes et que la forme alternative de Tuna, alt.Tuna (alternative Tuna), représente approximativement 45% des transcrits (Figure 7.C). De plus, les PCRs sur ADNc de mESCs montrent bel et bien l’existence des deux isoformes (Figure 10) parmi lesquelles alt.Tuna serait légèrement moins exprimée que sht.Tuna. Ce résultat suggère que Tuna est en réalité exprimé sous deux isoformes courtes épissées alternativement dans les mESCs. L’épissage alternatif est connu pour avoir de nombreux impacts sur les fonctions des ARNs, notamment lorsque celui-ci s’opère dans le 5’UTR ou la région codante des ARNm76,77. C’est pourquoi, l’épissage alternatif de Tuna pourrait

induire une modulation de sa fonction dans les cellules en affectant sa séquence et potentiellement sa localisation, sa structure secondaire, son interactome, sa stabilité…etc.

2.3. Tuna présente une séquence codante pour un peptide

Bien que la publication de Lin et al. (2014) adresse l’importance de la région CR1 dans la fonction de Tuna, l’analyse de sa séquence fait défaut. Notre nouvelle analyse elle révèle l’existence d’un cadre de lecture (ORF) potentiellement codant pour un peptide de 48 acides-aminés (Figure

8.A), également prédit par la base de données Ensembl Genome Browser (Annexe 1). Cet ORF

présente les caractéristiques d’une séquence codante puisqu’il comprend une séquence KOZAK (

CAAGATGGT

), un codon START (

ATG

) et un codon STOP (

TGA

). Ceci suggère que Tuna pourrait être traduit.

En premier lieu, nous avons déterminé la localisation subcellulaire de Tuna dans les cellules souches embryonnaires de souris. En effet, si Tuna est traduit il devra être transporté du noyau au cytoplasme où se trouve la machinerie de traduction des ARNm. Ainsi, les résultats de RT-qPCR sur des fractions d’ARNs nucléaires et cytoplasmiques de mESCs montrent que Tuna est à la fois nucléaire et cytoplasmique (Figure 8.B). Le profil d’expression de Tuna est similaire aux ARNm contrôles Oct4 et Nanog (deux ARNm hautement exprimés dans les cellules pluripotentes) contrairement à celui des lncRNAs contrôles Xist et Malat connus pour être majoritairement nucléaires37,78. Tuna se trouve

donc dans le bon compartiment cellulaire pour interagir avec les acteurs de la traduction.

Deuxièmement, pour être traduit, Tuna doit être reconnu et associé aux ribosomes. En effet, pour qu’un ARN soit traduit il doit posséder certaines caractéristiques comme celle d’être coiffé à son extrémité 5’. Un groupement m7

Gppp est apposé dans le noyau lors de la transcription, permettant la

protection de l’ARN de la dégradation par les exonucléases et garantissant sa reconnaissance par les facteurs essentiels à la traduction tels que eIF4E et ses protéines associées. Ces ARNs doivent également être polyadénylés en 3’, ce qui garantit leur stabilité et le recrutement de protéines, telles que PABP, qui interagissent avec les protéines du complexe en 5’, ce qui, in fine, permet le recrutement des ribosomes et l’initiation de la traduction79. Nous avons observé que Tuna était

polyadénylé considérant la présence de deux signaux de polyadénylation dans la séquence de son 3ème

exon (section 2.2) et l’enrichissement pour les ARN polyadénylés effectué en amont du séquençage. Il est donc possible que Tuna soit associé aux ribosomes, ce que nous avons d’abord cherché à vérifier par profilage de polysomes dans les mESCs. Cette technique permet de séparer en plusieurs fractions les ARNs associés aux ribosomes en fonction de leur poids moléculaire grâce à un gradient de sucrose. Les ARNs extraits ont été regroupés en 3 grandes fractions : Monosomale, Polysomale légère et Polysomale lourde. La fraction monosomale comprend les ARNs dont le poids moléculaire correspond à l’association avec un unique ribosome, la fraction polysomale légère à leur association

avec 2 ou 3 ribosomes et la fraction polysomale lourde à l’association avec 4 ribosomes ou plus. Ces ARNs ont par la suite été analysés par RT-qPCR (Figure 8.C). Ces résultats montrent que Tuna est présent dans l’ensemble des fractions ribosomales au même titre que l’ARNm contrôle Oct4, contrairement au lncRNA contrôle Xist qui ne présente que peu ou pas d’amplification, n’étant pas associé aux ribosomes par sa localisation nucléaire.

D’autre part, notre analyse de données de profilage de ribosome (réalisée par le Dr. Samer M.I. HUSSEIN) dans les mESCs80 vient spécifier la localisation des ribosomes associés au transcrit de

Tuna. En effet, cette technique de profilage se base sur l’isolement des fragments d’ARNs protégés par les ribosomes au traitement par ribo-endonucléases et leur séquençage subséquent par NGS (Next Generation Sequencing). L’alignement des produits de séquençage sur un génome de référence permet ainsi de localiser les ribosomes sur les ARNs traduits et de déterminer les points d’initiation et de terminaison de la traduction. Cette analyse confirme que Tuna est bel et bien associé aux ribosomes mais démontre également qu’ils se localisent de manière spécifique à l’ORF contenu dans la région CR1 (Figure 8.D). Ainsi, Tuna présente tous les signes de la traduction, au niveau de sa séquence, de sa localisation et de son association aux complexes de traduction.

Afin de confirmer la production du peptide à partir de la séquence de sht.Tuna dans les mESCs nous avons choisi de comparer la surexpression de différentes constructions plasmidiques tagguées par une ou plusieurs séquences « FLAG » en N-terminal - « N-term » - (Annexe 2). Nous avons comparé les niveaux d’expression du peptide après 2 jours sous induction à la doxycycline (Dox) par immuno- buvardage (Figure 9.A). Ce résultat montre que nous avons été capable de détecter le peptide grâce à l’ajout de 3 séquences FLAG répétées, mais pas lorsque les constructions avec un unique FLAG (1xFLAG) sont exprimées. De plus, la surexpression de la séquence codante uniquement, « pepTuna », révèle une production du peptide plus importante. Cela peut s’expliquer par le fait que cette séquence est artificielle et ne possèdent ni le Poly(A) naturel de sht.Tuna ni aucunes de ses éventuelles séquences régulatrices dans les 5’-UTR et 3’-UTR (Untranslated Region).

D’autre part, les régions 5’-UTR sont connues pour avoir un rôle déterminant dans la localisation, la stabilité et le pouvoir codant des ARNm par leur séquence (uORF, épissage alternatif, site de liaison à des protéines, site de reconnaissance par des ARNs régulateurs) ou encore leur structure secondaire affectant notamment la reconnaissance du transcrit par le ribosome81–83. Considérant l’importance du

5’-UTR dans la biologie des ARN codants et la capacité de Tuna à coder pour un peptide dans les mESCs, nous avons cherché à déterminer si l’épissage identifié dans la région CR4 de Tuna avait un impact sur son potentiel codant.

En ce sens, la comparaison de la surexpression de sht.Tuna vs. alt.Tuna dans les mESCs renseigne sur le potentiel codant des deux isoformes. En effet, aucune différence dans la quantité de peptide produite après deux jours d’induction (Dox) n’est observable par immuno-buvardage (Figure 9.B), ce qui suggère que l’épissage alternatif n’interviendrait pas dans la régulation de la traduction. Tuna ayant été précédemment identifié comme non-codant, il est possible de penser que cet évènement intervienne dans le rôle du transcrit lui-même.

Finalement, nous avons été également capables de détecter le peptide par immunofluorescence en utilisant un anticorps α-FLAG. Pour cette approche, les peptides taggués ont été produits via surexpression de la construction plasmidique ne comportant qu’un seul FLAG en N-term, dans les mESCs. Les images obtenues par microscopie confocale montrent la présence du peptide et sa localisation au cytoplasme (Figure 9.C). Cette localisation pourrait correspondre à celle du réticulum endoplasmique (RE) qui se localise autour du noyau dans les cellules. Si les marquages par immunofluorescence venaient à confirmer la colocalisation avec le RE cela pourrait conduire à l’hypothèse selon laquelle le peptide serait produit ou dégradé à cet endroit. En effet, certains polypeptides sont transloqués au RE rugueux grâce à une séquence signal, la traduction se poursuivant alors à travers la membrane endoplasmique84, contrairement à certaines protéines qui y

sont retenues pour être ensuite dégradées par le protéasome85.En considérant cela, notre incapacité à

détecter le peptide taggué 1xFLAG par immuno-buvardage pourrait s’expliquer par la dégradation du peptide alors que l’ajout de trois FLAG aurait un rôle stabilisateur.

2.4. Régulation de la stabilité de Tuna par NMD

La qualité des ARNm est garantie par de nombreux processus dans la cellule afin de limiter la production de protéines non-fonctionnelles ou de protéines dont la fonction est altérée, ayant le potentiel de créer des agrégats néfastes pour l’intégrité cellulaire. Parmi ces multiples voies de régulation, le NMD (Non-Sens Mediated Decay) engendre la dégradation des transcrits présentant un codon STOP prématuré, en amont d’une jonction exon-exon. Ces transcrits codent pour des protéines tronquées qui, si elles étaient produites, seraient non-fonctionnelles pouvant être délétères pour la cellule. Dans ce cas de figure, la présence d’une jonction exon-exon en aval d’un ribosome arrêté au codon STOP, c.à.d. prématuré, d’un cadre de lecture permet le recrutement des facteurs du NMD (FNMD) qui interagissent avec le ribosome et le complexe de reconnaissance des jonctions exon- exon (apposé lors de l’épissage des ARNs dans le noyau). Cette interaction permet ensuite le recrutement d’exonucléases, telle que XRN2, entrainant leur dégradation par digestion de l’extrémité 5’ vers 3’.

Cependant, le NMD est également essentiel à d’autres processus cellulaires comme la prolifération cellulaire ou la différenciation/spécialisation cellulaire86, notamment ceux du

maintien/différenciation cellules souches de l’embryon humain87. Ce mécanisme est également au

cœur du processus de cellules adultes notamment au cours de la maturation des cellules T du système immunitaire88. Ainsi, le NMD est aussi bien un système de contrôle de la qualité des ARNm qu’un

mécanisme actif du destin cellulaire. C’est pourquoi, l’existence potentiel d’un transcrit dit « NMD » de Tuna représente une piste intéressante dans l’investigation de son fonctionnement.

En considérant le potentiel codant de Tuna (présenté précédemment), et la prédiction d’un transcrit « NMD » dans la base de données Ensembl Genome Browser (Annexe 1), dans lequel la région CR2 -en aval du codon STOP de l’ORF étudié- aurait été excisée par épissage alternatif, nous avons émis l’hypothèse selon laquelle l’isoforme full.Tuna pourrait être transcrite mais dégradée dans les mESCs par ce mécanisme. Si elle s’avérait vraie, cette hypothèse viendrait confirmer et expliquer le résultat de RT-qPCR où nous n’observons pas d’expression de full.Tuna dans les mESCs (Figure 7.B). Dans un premier temps, nous avons cherché à déterminer l’existence du nouvel évènement d’épissage alternatif par PCR. Ainsi, nous avons généré de nouveaux jeux d’amorces, nous permettant de distinguer les différents transcrits de Tuna (Figure 14, séquences en Annexe 1). Les résultats obtenus sur plasmides contrôles montrent les tailles d’amplicons attendus, validant ainsi les amorces ainsi que les conditions d’amplification. En revanche, les amplifications sur ADNc de mESCs ne révèlent aucune amplification pour aucun des jeux d’amorces localisées en 3’ (Figure 10). Cette observation nous informe que les conditions de PCR utilisées ne sont probablement pas optimales pour une amplification à partir d’ADNc ou que ces isoformes ne sont pas exprimées/dégradées dans les mESCs. Si tel était le cas, cela renforcerait les résultats obtenus précédemment (Figure 7) et concorderaient avec notre hypothèse. Si le problème réside dans les conditions d’amplification de PCR, il faudrait déterminer la quantité optimale d’ADNc à utiliser ainsi que la température optimale d’hybridation des amorces. En effet, l’ADNc peut adopter des structures secondaires par complémentarité dans sa propre séquence, il faudrait alors augmenter la température d’hybridation afin de prévenir leur formation lors du refroidissement. Cependant, cette action pourrait également avoir un effet néfaste sur l’hybridation des amorces et ne pas améliorer le résultat.

Documents relatifs