• Aucun résultat trouvé

Corrélation entre l’expression des snoARN et leur gène hôte

PARTIE II : LA LEUCEMIE LYMPHOÏDE CHRONIQUE

G. Corrélation entre l’expression des snoARN et leur gène hôte

Non seulement les snoARN sont requis pour l’activité optimale des ribosomes, mais un tiers d’entre eux sont justement contenus dans des gènes hôtes impliqués dans la biogenèse des ribosomes et plus généralement la traduction protéique. La production des snoARN étant très dépendante de la production du gène hôte, l’augmentation de l’expression de gènes hôtes requis lors de la prolifération cellulaire augmenterait mécaniquement celle de beaucoup de snoARN. En l’occurrence, plusieurs études tendent à montrer que l’expression des snoARN est corrélée à celle de leur gène hôte, comme rapporté dans le MM et la LLC par l’équipe d’Antonio Neri[75, 144]. Dans ce travail de thèse, l’exemple du cluster SNORD116 montre que l’expression de tous les variants du SNORD116 est corrélée à celle de leur gène hôte SNORD116HG.

113

Cependant, la production d’autres snoARN semble découplée de celle de leur gène hôte. En effet, le gène de la DYSKÉRINE code également pour SNORA36A et pour SNORA56 (qui fait partie de la signature des 20 snoARN) et est surexprimé dans la LLC alors que ce n’est pas le cas des 2 snoARN contenus dans ses introns (Figure supplémentaire 1 A). Le calcul du coefficient de Pearson indique que l’expression d’aucun des 3 gènes n’est corrélée (Figure supplémentaire 1 B). Un autre exemple est celui de SNORD1A, SNORD1B et SNORD1C contenus dans les introns de leur gène hôte non- codant SNHG16. Le niveau d’expression de SNORD1A et SNORD1B (qui font partie de la signature des 20 snoARN) est corrélé dans la LLC et les contrôles CD19+ non soumis à un stimulus prolifératif in vitro, mais il n’est pas corrélé à celui de SNORD1C (Figure supplémentaire 2 A et B). En revanche, après induction de la prolifération dans 5 échantillons de LLC, on peut constater que l’expression de SNORD1A et SNORD1B n’est plus corrélée (Figure 24 C et Figure supplémentaire 2 C). Un mécanisme peut expliquer cette expression différentielle entre le gène hôte et différents snoARN produits à partir du même transcrit primaire. En effet, parmi les gènes hôtes contenant plusieurs snoARN, beaucoup sont non-codants et sont capables d’être transcrits en de multiples transcrits alternatifs. A l’heure actuelle, les différents transcrits alternatifs de la DYSKÉRINE, dont les séquences sont disponibles sur le site UCSC Genome Browser, sont capable d’expliquer comment la production des 3 snoARN peut être contrôlée (Figure supplémentaire 3 A). Concernant SNHG16, les transcrits alternatifs connus montrent uniquement que l’intron contenant SNORD1C peut éventuellement ne pas être épissé (Figure supplémentaire 3 B). Cependant, il est possible que d’autres transcrits alternatifs encore non décrits puissent réguler par un processus similaire la production des 2 autres snoARN.

Un dernier argument démontre la régulation fine qu’exerce la cellule sur le niveau d’expression des snoARN. Dans le cas des patients présentant une trisomie 12, anomalie couramment retrouvée dans la LLC (24% dans la cohorte d’exploration), une analyse différentielle ne retrouve que SNORD59B et SCARNA12 différentiellement exprimés, sur les 10 snoARN contenus sur le chromosome 12. Les fold change respectifs de SNORD59B et SCARNA12 sont de 1,63 et 1,57, correspondant bien à une augmentation de l’expression d’environ un tiers, due à la présence d’un chromosome 12 supplémentaire.

D’autre part, une étude très récente menée par l’équipe de Torben Jensen (Université d’Aarhus, Danemark) démontre que le Nonsense-Mediated RNA Decay (NMD ou dégradation des ARNm contenant un codon stop prématuré) peut être un moyen efficace pour la cellule de découpler l’expression d’un snoARN et de son gène hôte, mais également de réguler la production des différents snoARN codés par le même gène hôte[169]. Les gènes dont les introns codent pour des

114

snoARN sont capables de produire de multiples variants très sensibles au NMD. Ce mécanisme permettrait donc d’expliquer les différences d’expression observées dans cette étude entre SNORA56, SNORA36A et la DYSKÉRINE. De plus, en accord avec l’hypothèse formulée ci-dessus d’une balance protéique régulant l’activité des snoARN avec un rôle dual, le NMD pourrait, sous l’effet d’un stimulus particulier ou dans un contexte pathologique, contrôler le niveau d’expression des protéines participant aux diverses fonctions des snoARN, favorisant alors leur interaction soit avec le complexe canonique des snoARN responsable de la fonction classique, soit avec une autre RNP responsable de la fonction non canonique.

Conclusion :

Au cours de ce travail de thèse, j’ai pu démontrer par une technique de transcriptomique quantitative à grande échelle que l’expression des snoARN était dérégulée dans la LLC. Mes résultats indiquent qu’ils pourraient être utilisés comme biomarqueurs afin de mieux stratifier le risque de progression de patients pour lesquels les marqueurs pronostiques actuellement disponibles ne sont pas suffisants. La littérature de ces dernières années, ainsi que les résultats obtenus au cours de l’étude fonctionnelle du SNORD116, soulignent l’importance d’approfondir nos connaissances des mécanismes qui pourraient être impliqués dans les nouvelles fonctions des snoARN. Le développement de techniques permettant d’identifier les interactions ARN-ARN, pourrait permettre d’apporter enfin des réponses plus claires sur l’étendue des fonctions cellulaires dans lesquelles pourraient intervenir les snoARN.

115

ILLUSTRATIONS

SUPPLÉMENTAIRES

116

Tableau supplémentaire 1. Liste des amorces utilisées dans l’expérience de Fluidigm

snoARN H/ACA Séquence sens (5'-3') Séquence anti-sens (5'-3')

SNORA1 CCTCA TTCTAGAGAATGGGCACTG GTTACA GGTCTCA TTGTCA CCACTG SNORA2A CTGAA TCA AGACCA ATGGTTTGCTG CA ATTCGCACTGGAA TA CTGAA TAGC SNORA3 CGCTTGGGTATCGGCTATTGCC GCATGTCTCTA ACCTGGTGA CTGAC SNORA4 A AGACCA CA CTCCA CA GTGG CA TGTA GGCCACAA AA TAGTA G SNORA5A GCA GCCGTGTCA AA TTCA GTACCTG GA GTCACAGTGTTTCTGTGGCAGCC SNORA6 CCA GTCTTGGCTCATGAA CTTCTG CTCCA GTCATAGAGGCA AGCTCTA C SNORA7A CTGGGATCGCATCTGGAGAG TGTCGCAGAGTGTCTTCCAA TCG SNORA7B CCTGGGATCGCA TCTGGA GA C ACTGTCGCAGAGTGTCTTCCAATCA SNORA8 CACTCAGCAGTTTACA CCTGCTA GG AGTAGAA ATA CCAGGTTTAA CA AGCA C SNORA9 CCTTCA GTGCTTGCTAGAA CA GT TTCTATA ACCTTGCTCTGGATGG SNORA10 GTCTCTCAGCTCCGCTTAA CCAC GGTCTGTCGTGCA TTA GGAGAGC SNORA11 CCA AA GA ATGGCTCCTCTGT GTTCATAGGGAA GCCACAA G SNORA11B CGA AGAA TGCCTCCTCTGTT TAGGGCA TTTGTTTGTA GGG SNORA11C CAGGGGGCCTGA AGAA TG TGTGGGGCATTTGTTCA TA G SNORA11D CCTGA AGA ATGGCTCCTCTG TAGGGCA TTTGTCTGTA GGG SNORA12 GGGCCTAA CTCTGCCACATA ACATGTGGGA GCCA TTCTCT SNORA14A GTGGCTTCCCTGTA AA TGCTTCCA AG GTTGCA GGTA TGA AA TAA GA CTGAGC SNORA14B CTCTTGGTA GCTTCGTTCTA AGTGC CA GGTATGAA ATAAGACTGAGCCA CG SNORA15 GCA TGGCCGA ATACTGTGTT AA CCTTAGCA TA CCA TCAGTCA TTC SNORA16A A TCGA AGCTGCA GCTGCTTCCG TCA GTTACAA CA AACAGAA CGGCG SNORA16B TCA AA GCTGCAGCTGCTTCCATG ATCAGTTA CA GCAAA CA GA ACTATG SNORA17 CCTAGAGGCGTTGCA GCTGTG GCAGA ACGCTGAGCGTAGACATA G SNORA18 GTTGAGGTCTA TCCCGATG TGTCTTGTA ATTCCTTCCCA CA G SNORA19 GTGAGTAGTGTTATTTCTTATGTGC TGA AGGA GA CTGGCAGCA TTA C SNORA20 TTGCTGCTTGTA GTCTCA CA GTGA TAC GGTTACTTCATCTCAA TTTA CA GTGGC SNORA21 GCA CTCAA TGGGCCTGTGG CCTTGTCA CA CCACCGA TTG SNORA22 GCA CA GTGAA CA CCCA AGTGTGC TTA ATGCA GA GGAGA AGAGCA GGC SNORA23 CATCTGTGTCTGGTAGCAGTGTCTG GA CAA CA CTAGACCAGTA CTA TGA TC SNORA24 CTCCA TGTA TCTTTGGGACCTG CCAATTAA ATGGTGA CA GCTTTG SNORA25 GCTTATGAGGCTGTGA AA CCCA G GCACCAA ACATTAGGA GTGCTATGG SNORA26 TTAA GA GGCTA ACACAGAA GGG AGTTGTGA CTCCA GA CA GGATC SNORA27 TCA CTTTGCCA GTTGGA CTTATGTC CCTCTGACAGGA TACAGACAA ACAC SNORA28 A GCAA CA CTCTGTGGCA GA TGA TC CTTGTCTCA TGGGA GA GA GA ACAC SNORA29 TCA TTTGACTACCA CA TTTTCTCC AA TATCCGTTCAGCCATTTCA SNORA30 CTGGCACTTTCACAGTTCCTTC CA CTGTCCCA TTGAGTGA CA GTTG SNORA31 CTGCA TCCACTGA TAGACCTTGA AC CA CAA AGACAGACAGAA AGCGCAG SNORA32 GCA GTTTCTCA TTTGCTGTGGA CA TG CTGTTCCCAA TAA GCTGA TTGCTA GC SNORA33 CAA TGAATCTGCTTACCTGATTGT CCTTAA GGCTCGTAA CA TGGC SNORA34 CTGACTGA AGACCA GCA GTTGTAC ATA GCCA TTCCCTACTGA GGTC SNORA35 GGCTCCATCTTGA CCA ACTGG CCAGCTGCA TGCAGGA GTA GC SNORA36A CCA AA GTGTTGAGTTCAGTCCAGG CTTTCTA CCCA ATCATCTCCCTTA GC SNORA36B TCCAA AGTGTTAA GTTCAGTTCAG CCTAGCCAGTTTCAA TGTTCCAA AG SNORA37 TGA GCACTTTCACAGGTCCTC ATTGTCCCATTGAA TGACAGCTG SNORA38A CCCTCCTA CA AA GGCATGT TGTGGGATGGTTGA TCTTGA

117

SNORA38B CCTACAAA GGCA TGTCTA TA GTTCC GA GCCTGCGGA GAGCA AGCT SNORA39 CGCCTGCA TTCGTAAGTGAT ACAGGAGGGTGAAGATGTGG SNORA40 CGTGGACA AA GA CTTACAGATA GGTG CTCATA CTGA ACAATGA GTTCTGGG SNORA41 A GCTA CTGGTCTGCAGCTGTTC TGTGTCTGTCA CACATATA TA CCC SNORA42 GCCTCTCA TAGTGTACCCATGC CTTCAGTGCTCACAGCCCA CA G SNORA43 CACAGACAGTTGCTCTGCTGTGC CA TTCTCA GTGCCCA CTGGTTCC SNORA44 A CTGCATGCA AGAGCAA CCTG CA TTATAGGA AA GCTGA GTGGC SNORA46 CCA TTCTTGGTTACGCTGTA GTGC CCATGTTCCTTAACTCTATACAGCAA C SNORA47 GCTGCCTTCCA CCGGTTA AGACC CA AATGTCGGCCAGCA CA GCG SNORA48 CTCCA GGGACTTTTTGTTGC CCCAA AA GA AA ACAGCGTCT SNORA50 GCA CTGCCTTTGA ACCTGATGTG CA GTTCAGTTGAGAGCTGAA GA GC SNORA51 GGCTGTGTTCTTACACTGA C CA CAA TA CA GA CCA GGCA CA GG SNORA52 CTGCCAGGTTTCGCTTGTGGA C CTA GA AGTGCCCATGACGTGA GC SNORA53 TCCACCTTTGTGGA TGA ATCT AA ATGTCCGCACACGA GTC SNORA54 GAGCA CTGTTCGTAACCCGTTAG CCACCAGTCAGTCA GTCATGTGTC SNORA55 GGA CA GA TGGTGCTA CA GA ATGAGC GTGGCAGAGCTGTAGAGACAGG SNORA56 A GTCA GTCTGCAA CA GTA AGTG TGTTATCTGGCAAGTCTAA AGCC SNORA57 GTA ATGTACGGAGGA AGAGGG TGA GGATA GA ACCA GCGGATGG SNORA59 GCCCA GGGTA TGTTCA CG AGCTGTTCCTTATCACCA ACG SNORA60 GCTGCCTGTGCTCTGGTCA TCAA GGACA GGTGTGA ACCCTCCAA AC SNORA61 CATCGGATCTGAA CA CTGGTCTTG CCACA TGCCATA TACCA GA TTA CA AC SNORA62 CACATTGTTAGAGCTTGGA GTTGA GG CCTTGTGGTGTTAGCGAA AA CTTGC SNORA63 GCA GGATTCA GA CTA CA ATA TA GCTGC CTGGCTGCTA CA GGA GA ATAGCAG SNORA64 TGCATA GTTGCACTTGGCTTCA CC CA AGGAA AGAGAGGCCA CA GTA AG SNORA65 A CTGCACCTGACCA GGTCTCTG GCACA GA GTCA TCCACATGAA GA AC SNORA66 GCA AA CTCGA TCACTAGCTCTGCG CTCAGTAGTGTCTGAGGCTA ACA C SNORA67 GGA CA TCA GTGCCTCTCA GGAA AG GCAGCCA AGGA AGGCAGAGGAA SNORA68 CACCTAAA CCCA AGAA TCA CTGT TGTGGA ACCTCCAAA TTCACT SNORA69 A AGCA GGTTGCA ATTA CA GTGCTTC CTGTCA TGATTTTACCCTCATA AA GGC SNORA70 CCGCA GCCA ATTAA GCCGA CTG CA ACCAA CA GGCTGCGTA CA CTA C SNORA71A CCTGCATCCGAA AGTGA TCA TA GG AGTTGTGTGAA AGCTTCA GGGTTC SNORA71B CCTGGTCA TTGATA GTGCA GGGA GA G GCATGTACGA AA GCTCCAGAGTTTGG SNORA71C CTGGTCATTGGTAGTGCAGGGAGAG GGTTTGGA AGAGACA GGAGTGGACC SNORA71D CCCTGGTCATTGA TAGTGCAGGG AGGTGTGA GA AA GCTCCAGAG SNORA72 GCGAA TATTCTCGCTGTTCTGA TTTTG ACCAGACCTAGGGA AA GA ACTAGG SNORA73B A TA CA CCCGGGA GGTCA CTC GA CAGGA CTCTGGGAA GCTG SNORA73A GGA TA CCCTGGGAGGTCACT CA TGGTTTGTCTCCCCAGTC SNORA74A GGTTGTCAGCTATCCA GGCTCATG AA CAGTGCTTGGAGCCA AA CCTC SNORA74B CCTGTGATGGTGTTACA CTGCTGG GA AGCACAGCTCTGTCTTGCACC SNORA75 A GTGGCAGTTTATGGA TTCGCACG TCTCACAA TA CA GCTAA ATA TACCTCTG SNORA76 GGTCA ATCTGCAGCGCTA GA GC CTTGTCGCTCGCGGTTAA AA AGGC SNORA77 GCA GA CTCACTA TGCACCTG AGGTGAGGCAGCCA CA GCAC SNORA79 GATGA CTGTTCTTCCTGTTGCCTTC ACTCCATTATCCTA ATATTCTCTGA GTG SNORA80 CCA TGCCA GA GCAA ACTGTAGCC GTGCA ACCCACTTCA GTGCCA G SNORA81 GCA GA CA CTA GGACCA TGTCTTGG TTGGACATTAA GA AA GA GGTCCACC SNORA84 GGTTGCTGGATGCTGTTGT CTA TGGCA GCTGCTGAGGA

118

snoARN C/D Séquence sens (5'-3') Séquence anti-sens (5'-3')

SNORD1A CA CA AGCCTA TGA TGGTTA GTTATCC GCCTCAGAA TA GA TTA TTTCCCTCAG SNORD1B GCTGAGTCCATGATGA TTTCAA GTTAT CTGA GTTTCA GA TATTCA AA TTCCA CA C SNORD1C GA GCTGAGGA TGA TTTA AA GTTATCCC GCTGAGCCTCA GCAA GTCAGAC SNORD2 AGTGAA ATGATGGCAA TCATC CA AGTGA TCAGCA ATGAGTA TTC SNORD3 CGTGTAGAGCA CCGA AA ACC CA CTCAGACCGCGTTCTCTC SNORD4A GGTGCA GA TGA TGA CA CTGTA AA GC GGTGCATCA GA CA ACGA GGTACC SNORD4B GGGTGCAA ATGATGCA TA TGTTAGC GGGTGCA GTCA GTTAA TTA TGA CTAA T SNORD5 GTTCA GA TGATGAA TTTA ACTGTTCAA C CTCTGTCA GA ATTAA GTTTTA GTTCA TG SNORD6 GA TGTTA TGA TGATGGGCGAA ATGTTC GA TGTTCA GA AA GGCCATTTTCATTCA G SNORD7 ATGCGA TGA TGAGTGA AGTAGAGCC CA GCTCA GA GA GA AGATTAA GA GA TC SNORD8 CCAA TGATGAGTTGCCATGCTAA TAC CCTCAGA TCTTCATGTGAGAA GTTTTG SNORD9 CCTGTGA TGAGTTGCCA TGCTA ATA CCCTCAGCA TTTACGA GA AA GA GTT SNORD10 CA TGCGTGTCA TCTGAGCCTCT CA GA GTA CA AA GA CTGA TCCTTTGC SNORD11 CA ATGA TGA TTTCTA TTTGTTTGCCTG GTGTCTCA GA AGAGGTAGTGA CTAA SNORD12 GCCTTTGCA GCTGA TGA TA CA GC GCCA ATA GTGTA GA GA TCAA CA GG SNORD12B GCTGGCATA TA TGA TGA CTTAGCTTT GCTGGCA TA TCA GA CA GA AA CTGG SNORD13 CTTTTGTA GTTCATGA GCGTGAT GGTCAGA CGGGTA ATGTGC SNORD14A CA CTGTGATGA TGGTTTTCCAA CA TTC CTCA CTCAGACATCCA AGGA AGG SNORD14B TCACTATGA TGA TTGGTTGCCA GA C CTCA CTCAGACATCCA AGGA AGAA C SNORD15A AGAGATGA TGA CGAGTCTGA CTTG TGTGCCA CA GA ACGCAGCA CA GA G SNORD15B CTTCA GTGA TGA CA CGATGACGA G CCAA AGGA ACTCGTGCA CA GCAC SNORD16 GCAA TGATGTCGTA ATTTGCGTCTTAC GCTCAGTAA GA ATTTTCGTCAA CCTTC SNORD17 GA ACTTGAGGCTATGTA GCCTGA TCTTACCGGTAGCCTGCCA AC SNORD18A CA GTAGTGA TGAAA TTCCA CTTCA TTGG CA TCAGA ACATCCGA GA AA ATCATGTG SNORD18B CA AA ATGA TGA GA TTCCA CTTAA TTGGT AGTCAGA ATTTCCA CA AA TATCA TGTGT SNORD19 ACATGGGTGAGGTA CGAGGA AA CA GGCTTTGCTGAGATCAGAGTTGGA TCTA SNORD19B GTTGA AA TA TGA TGA GTGTA CA AA ATCTTG CTCTGGCTGA AA TCAGAGTTGGA TCTT SNORD20 TGGA TATGA TGA CTGATTACCTGA GA A CTGGATCAGAA CTTGA CTA TCTAGAG SNORD21 GCTGAA TGA TGATA TCCCA CTAA C CTGCCATCA GTCCCGTCTTGA SNORD22 TTTCA CA TGTCTTA CTCTCTGTCC CCTCAGA CA GTTCCTTCTGG SNORD24 TGCA GA TGA TGTAA AA GA ATA TTTGCTATC TGCA TCA GCGA TCTTGGTGGTTTAA SNORD26 CTACGGGGATGATTTTA CGAA CTGAA GCTA CTCAGAA TTTTCTGTTTTCTCCAC SNORD27 CTCCATGATGA ACA CA AA ATGA C CTCA GTA GTA AGATGA CA TCA CTTG SNORD28 GTCA GA TGA TTTGAA TTGATAA GC GCCA TCA GA ACTCTAA CA TGC SNORD30 GTTTGTGA TGACTTACATGGAA TCTCG GA AA ATCAGATTTCAGAGTCTCA ACAGC SNORD32A GTCA GTGATGA GCA ACATTCA CCAT CTCA GAGCGGTGCATGGGGTT SNORD33 CGGTGA TGA GA ACTTCTCCCA C CCTCAGA TGGTA GTGCATGTGG SNORD34 CGTCCA TGA TGTTCCGCAA CTAC GCGTCTCAGCCAGTGCTGCT SNORD35A GGCA GA TGATGTCCTTA TCTCA CG CTCCTGGCA TCA GCTA AGCCATT SNORD35B GGCA GA TGATGTTTGTTTTCA CGATG GCATCAGTTTTACCA AGTGGCTTTC SNORD36A GCAA TGATGTGAATCTCTCACTGA ATT TTGCTCAGGGTTA AA AA GCTCATGG SNORD36B GTTGCAGTGATGTAA AA TTTCTTGGCC ACTCAGTGTTAA AA AGCTCGGTTTTAC SNORD36C GCCA ATGA TGGTTA AGAA TTTCTTCAC TTTGCCTCAGATGCA ATGCTGA CC SNORD37 ATTCGTGATGACTGA TCATTTCTTCA C CCTCAGA CGCA GGCTTTCTTCA SNORD38B CTCA GTGATGA AAA CTTTGTCCAGTTC TCTCCTCA GA CA CA CTTTA TCTTCA C

119

SNORD41 TGGGAA GTGATGACACCTGT GGATCAGCCAGTA CGAA TACGC

SNORD42B GTGCATA TGATGGA AA AGTTTTAA TCTCC GTGCATCAGTGGTTCCTTTGAA GA

SNORD44 CCTGGA TGA TGATA AGCA AA TGC GTCA GTTA GA GCTA ATTAA GA C

SNORD45A GGTCAA TGA TGTGTTGGCA TGT AGGTCTCAGAGTAA TTCTA GA GCTA

SNORD45C GGTCAA TGA TGAGTTGGCA TGTATTC GGTCTCA GA GTA ATTCTAGAGCTA AA G

SNORD46 AA GA ATCCTTA GGCGTGGTTGTGG GTCA GTGTAA CTATGACAA GTCCTTG

SNORD48 AGTGATGATGA CCCCA GGTA ACTC GGTCAGA GCGCTGCGGTGAT

SNORD49A TGCTCTGATGAA ATCACTA ATA GGAA G AA TCAGA CA GGAGTA GTCTTCGTCA

SNORD50B TA ATCAA TGATGAA ACCTA TCCCG ATCTCAGAA GCCGAA TCCGTAC

SNORD51 GTTGCATGA TGA ATA AA ATCA AA T AA GCAA ATCCA TCACGA ACTCA G

SNORD52 GGGA ATGA TGA TTTCACAGACTA GA G TCAGAACTTA GTTTTGACATCA TGA CC

SNORD53 GCTA TGA TGACATCCA TATGGTTTCG ATGCTCA GA CA GCCA AGAGAA AGG

SNORD54 GGCGATGA GGAGGTA CCTATTG GA ATAGCGTATA AA ATTATCA CCG

SNORD55 GTGTA TGATGACAA CTCGGTA ATGC CTCA GCTCTCCA AGGTTGGC

SNORD56 CCACAA TGATGGCAA TATTTTTCGTCA TCACTCA GA CCCA GA GTCTCAA C

SNORD57 TGGA GGTGA TGAACTGTCTGA G GGATCAGGCTCATTAA ATCAGTT

SNORD59B TA TTCCTCACTGATGAGTACGTTC CCTTCTCA GA AA TTGCA TCTGGC

SNORD60 GTCTGTGATGAA TTGCTTTGA CTTCTG GCCTCAGTCTTGCTA AA TA ATCAGAC

SNORD61 GCTA TGA TGAA TTTGATTGCATTGA TCG AA GCTCA GA ACTTCTTA GA GGACAA AA A

SNORD62 TTCCA ATAGATCCTTCTGACCCTCC CTCTCAGTCA CTGTCCTCTTCA TCTCC

SNORD63 GTGCAA TGA TGTATTTTA TTCAA CA CA TC TGTGCTCA GTCA TTA GTTTTCCA CA C

SNORD64 GGATTTGTGA TGAGCTGTGTTTA CTG GGACTTCAGAGTAA TCACGTTGA GC

SNORD65 AA ATGA TGA AA TCA CCCA AA ATAGCTGG CTTCA GA AA ACCA TAGGTTCA CCACT

SNORD66 CCTCTGA TGACTTCCTGTTA GTG TCCTCAGATCCTCA GTTCCATC

SNORD67 GTGA TGA GTTGCACACTGGTGGA GC CCTGTGCACTTGATTTTGTCA CCAGGG

SNORD68 CGCGTGATGACATTCTCCGGA AT AA TCAGA TGGA AA AGGGTTCAA ATGTGC

SNORD69 ATGA TGA TA AA CTGGA TCTGA CTG CA TGAAGCTCA GGGTTGGATTG

SNORD70 TTGTTGTCAA TGA TGTATTCTTCTTGG CA TCGTTGTCTCA GTGGTAGTGACG

SNORD71 GTTTA AA CGTGCTTTGTGTGTTGGAGGA TG GTTTAA ACAA AA CGTGTGCTGTCA GCAGTTTG

SNORD74 CTGCCTCTGATGAA GCCTGTG CCACCA TCA GA GCGGTTGGC

SNORD75 AGCCTGTGA TGCTTTAA GA G GCCTCAGAA TA GA ATTTCA GA AA TCC

SNORD76 GCCA CA ATGA TGA CA GTT GCCTCAGTTA AGATAA TGGTGG

SNORD77 GA TA CTA TGATGGTTGCATA GTTC AGATACA TCAGACAGATA GTACATC

SNORD78 GTGTA ATGA TGTTGA TCA AA TGTCTG CA GTGTTA CCTTTGTCTA CA TGCTCA

SNORD81 CA GA ATACATGATGATCTCAA TCCA AC CA GA ATA TCAGATA TTTTATTGTCA TC

SNORD82 ACAGCA CA AA TGA TGAA TAA CA AA GG ACAGCA CA TCA GCACACTA CA ATGTA

SNORD83A GCTGTTCGTTGA TGA GGCTCAG GCTGTTCTCA GA AGGA AGGCAG

SNORD83B GCTGTTCAGTGA TGA GGCCTGG GCTGTTCTCA GA AGGA AGGCAA C

SNORD84 GCCA TA TGA TGTTTTCTTTTCGAA AGGT AGCCATCAGTCAA GGGTGATAGATG

SNORD85 GA CTGGCA AGGATGA TACACACTTG GA CTGGCTCAGAA CA ATGCTCTCATC

SNORD86 ACGGTGATGGCTGA CCAGG ATCA CTCAGACACCA GGACT

SNORD89 CGAA TTGCA GTGTCTCCATCA GCAG ACTGAGGTCAGACTAGTGGTTCG

SNORD90 GA ATTTCATA GGGCAGATTCTGAGGTG CA AGTGTCTTCA GA TTCCA CA GTA GG

SNORD92 GGTGCTGTGATGATGCCTTA ATATTG GTGCTCA GA CA CA GCCA AGGA ATTG

SNORD93 GGCCAA GGATGAGAA CTCTA ATCTG TGGCCTCAGGTA AA TCCTTTAA TCC

SNORD94 GGTA CGGA CCTCA GCTGA GTC CA GGCTCAGATTGA GGCA ACAG

120

SNORD97 GA CGCGTTA TTA AGAGGA CT CTCA CAGGA CGCTGGACAT SNORD98 GA GTTATGA TGTGTGTAA ATCCTATTCC GA GTTCA GTTCA TTGTGTTCCACACT SNORD99 ACTGGTCCA GGATGAA ACCTAA TTTG CCTA GGA GCTGGTCTCAGTCC SNORD100 GCTGTACATGA TGA CA ACTGGC GCTGTAA TCA GA AGGGTGACATG SNORD101 TGAA TGA TGACTTTA ATTGTCGG GTTTGTCA GA CTCTTA TGTTTCACTC SNORD103 TTGTCTGGCA ATGATGA CCCA CTTG Tgt CTGGCTCAGAA CTTGA GTCCAT SNORD104 GGCCTGCTGTGATGACATTCCAA GGCA GGCTCAGACTCCA GTTC SNORD105 CCTA TCTCTCATGATGA ACACATA TGC CCCA TCTCTTCTTCA GA GCGTTTAC SNORD105B CCACATGCGGCTGATGACAGC CA CA GTGCGTCAGGGCGTTTA C SNORD107 GGTTCATGA TGA CA CA GGACCTTG GA TTTCAGAGTGTCA TTTTTA AGCTCAA A SNORD109A GGATCGATGATGAGAA TA ATTGTC GA CCTCA GA TTGACATCTGGA ATGA G SNORD110 TGCA GTGATGA CTTGCGAA TCAA ATC GCTCAGA GA CA TGGA GA CA TCA GTG SNORD111B CA GCCTGA AGTGA TGA TTCACATTC CTCTA GA GGCCTGA TCAGACACAC SNORD112 TGGA CCAA TGA TGA GA CA GTG GTGCAGA ACTGGA TTA ATCATG SNORD113-1 GTGA GTGATGA ATA GTTCTGTGG GGACTTCAGAGTTTA GGGTT SNORD113-2 TA GCCA ATCATTAGTATTCTGA GC AA CCTCTGA GTTACAGAA TCTA SNORD113-3 AGACCA ATGA TGA GTA TTCTGG TGGA CCTCA GA GTTACAGGG SNORD113-4 TGGA CCAA TGA TGA GTACCA TGG GCATATGGGTTTA ATCA AA AA TCC SNORD113-5 GGATCA ATGATGATTGGTG AGATCTCAGAGTTA CA CA GA GG SNORD113-6 TGGA CCAGTGA TGA ATATCATG TGGA CCTCA GA GTTGCAGATG SNORD113-7 TGGA TCA ATGA TGA GTA TGCGT GA CCTCA GA GA TA CA GA CA GG SNORD113-8 TGGA CCAA TGA TGA GA TTGG GGACCTCAGAGTTA CA GA TGGC SNORD113-9 GGATCA ATGATGAGTA CCCTG TGGA CCTCA GA GTTATA GGG SNORD114-1 GGACCTATGATGATGA CTGG TGGA CCTCA GA CTTCCAGACC SNORD115-2 GGGTCGATGATGAGAA GCTTCTG CCTCAGCATAA TCCTA TTGAGCA TG SNORD115-3 GGTCAA TGA TGAGA ACCTTATATTGTC CCTCAGCGTAA TCCTA CTA AGCA TG SNORD115-7 GGTCAA TGA GA ACCTTATA TTGTCCTG CCTCAGCGTAA TCCTA TTA TTGAGC SNORD115-35 GGTCAA TGA TGAGA ACCTTGTATTATC CCTCAGTGTA ATCCTATTGA GCATG SNORD115-37 GGCTGA TGA TGAGA ACCTTATATTGTC GGCTTCA GCATA ATACTATTAA GCATG SNORD115-39 CA ATGA TGA GA ATCTTA TA TTGTCCTG CCTCAGCGTAA TCCTA TTGAGCA TG SNORD116-1 TGGA TCGATGA TGA GTCCCCTATA GGACCTCAGTTCCGATGA GA ATGACG SNORD116-2 TGGA TCGATGA TGA GTCCCCA AA TGGA CCTCA GTTCCGA TGA GA ATGA C SNORD116-3 CCCA TA AA AA CATTCCTTGGA AA AGC GA CCTCA GTTCCGA TGAGAA CGAC SNORD116-5 TGGA TCGATGA TGA GTCCC GGACCTCAGTTCTGATGAGAA CGACG SNORD116-11 GGATCA ATGATGACTTCCA TA CGTGG GGACCTCAGTTTGA AGAGGA TGA CA G SNORD116-14 TCGA TGA TGACTTCCATATA TA CA TTCC TGGA CCTCA GTTCGACGA GA ATG SNORD116-16 GGATCGATGATGACTTTCA TACATGC GA CCTCA GTTCGACGA GGATGA C SNORD116-23 TGGA TCGATGA TGA CCTCA ATAC GA CCTCA GTTTGACGA GGACGA CG SNORD116-24 GGATCGATGATGACTTTTATACATGC GGACCTCAGTTCAA CGAA GA TGACG SNORD116-25 GGATCGATGATGACTTTAA AA TGG GGACCTCAGCTCA CA GA AGTGG SNORD117 AA CA GGAGCA CCTCA GTGCAA G AGCCATCAGTCATGGGTGATA G SNORD118 CGTCAGGTGGGATA ATCCTT CGCA GA GA CGTTA ATCACG SNORD121A CTTAGTCCA GA AAA CA ATGA TGTGGTAA CTTTGTCCAGGA AA CTCAGGTAGTTA A SNORD123 GGTGAA AA TGA TGA ATTCTGGGGC GGTGAATCA GGAA ATGGA TGGC SNORD124 TGGTCTCAA GGAAGGGATGA TTGCCTCTAGGA AGGTCAGG SNORD125 CTCCTGA TGATTCTTCTTC CA GTCAA CTTCTTAGAGGCTCAG SNORD126 TGCA TGTTAA GTCCGTGT AGTCTGCTCA GA GCATGTGT

121

scaARN Séquence sens (5'-3') Séquence anti-sens (5'-3') SCARNA2 GTGA TGA ATTGA TCA GA TA GA CGAGG CCAGATCAGAA TCGCCTCGA TA ATC

SCARNA3 GA AGCTGCTGGAA CCAGCCATG CCTA AGCCA GA CA GA GA CCTCC

SCARNA4 CTGGAGGA CTA AGAA GGCTGAGTC CCTGTGA TACTCTTCAGTGA AGGC

SCARNA5 GCTCACAGCTGACGA GTA TCCA AC CTTGA GA TCA TGCA CCATCACACC

SCARNA6 GCAGCTGA CA CTCCGTGA TGTC CCACAGATA CCAGCA CTCCCA

SCARNA7 GGCA CTGA CTGGTGATGCTG GGTGGCA GGCTAGTTA GGTGA G

SCARNA8 GCTCTACTTGTCACCATGCCTCC CGTA TCTGTCCGTTA CGATTTCA CTC

SCARNA10 GTGGTAA CTGGAGTGA GA GA GTA GG CA TCTCTCAGTGGCCA TAA CA CA AGC

SCARNA11 CTGTGCTCA GTTCTA ACAGGGTAG CTCTCGTGCCTTTAA GA GCCA GC

SCARNA12 GA ATGCGA CTCCGTGCTCTCTG GGAGTCA TGGCTCA GGTA CTA CC

SCARNA13 GA GA GCCA GCTGTTCCATGTGC CTGCAAA GCTTCTCTTA CTGTTGGC

SCARNA14 GTACAGTGCAA CCATA GA CA GTCA C ACATGTA TGGAGCCATCGCA CA G

SCARNA15 GA CTAGAGTCA CA TCCTGACAC GTATGTTTCTGATCTGGGCA CTA

SCARNA16 TGCA GCATGGTACCAGGCAGC AA CTGCTGCTAGAA TGCTCACACC

SCARNA17 TGGCCGATGATGACGA GA CCAC CCTCAGTCTGTTCTCAGAA CA TAC

SCARNA18 GTCTGCTTCTCA TTCCTTGGGAGC CA ACCTTTACTA GA AGGTTGGCA GC

SCARNA20 CTGTTCTCCTTAGCCAA GGCTGG CA TGTCTGAGGCAGGA AA ACAA GGC

SCARNA21 CTCA GCCGAGCCTAGAGTAGAG ATGTGAGGCTAGGA CA GCCCAGG

SCARNA22 TCACTAA GGCTCGGTCCTCTCCA C CTGTGTCCACTGAGACAGGA CA CC

SCARNA23 CTTCTCA AGGTGAA GA TAA CTCT ATGTCAGTAGTGGA ACGA CC

Autres gènes Séquence sens (5'-3') Séquence anti-sens (5'-3')

SNORD116HG GTGCTGGTGGTGTTGGCATGAGG GGATACA ACAGCCTCCA AA GGAGC

DYSKERINE GGTGAGTTGTGA GGCTGGCAC GCACATCATGCATTGTCACCA TG