2 Travaux précédents sur les miARN 13
2.1 Biogénèse des microARN 14
Le premier miARN (lin-‐4) a été identifié en 1993 dans l'organisme C. elegans par son effet sur la protéine Lin-‐14 durant le développement embryonnaire. Le mécanisme d'action proposé pour la régulation de Lin-‐14 par lin-‐4 impliquait une interaction anti sens entre lin-‐4 et une région du 3'UTR de Lin-‐14 complémentaire à lin-‐4 (Lee, Feinbaum et al. 1993). Ce mécanisme a été démontré peu après par l'utilisation d'un gène rapporteur contenant la séquence complémentaire à lin-‐4 (Wightman, Ha et al. 1993). Un autre miARN, let-‐7, a été identifié en 2000, toujours chez C. elegans (Reinhart, Slack et al. 2000). Peu après, ce miARN (mais non lin-‐4) a été détecté dans plusieurs autres espèces incluant D. melanogaster et H. sapiens (Pasquinelli, Reinhart et al. 2000). En 2001, toujours dans C. elegans, un ensemble de miARN ont été identifiés simultanément par divers groupes (Lagos-‐Quintana, Rauhut et al. 2001, Lau, Lim et al. 2001, Lee and Ambros 2001). Ces résultats et l'identification d'un miARN chez les vertébrés ont fait perdre aux miARN leur étiquette de curiosité spécifique aux nématodes. Ces diverses évidences ont permis d'émettre l'hypothèse que plusieurs autres miARN existent et restent à être découverts dans la majorité des espèces. Une conséquence de cette hypothèse étant qu'ils constituent un réseau de régulations post-‐transcriptionnelles complètement inconnues jusqu'alors. L'importance des implications de ces découvertes a mené à plusieurs études des mécanismes de transcription, maturation et régulation des miARN et de leurs rôles
biologiques. Ceci est bien reflété par la croissance importante du nombre de publications scientifiques sur les miARN depuis leur identification (Figure 2-‐1).
Figure 2-‐1 Croissance des publications sur les miARN.
Nombre de publications répertoriées dans Pubmed, par année, correspondant au mot-clé "microRNA" depuis leur identification en 2001 jusqu'à la fin de l'année 2011.
Il existe plusieurs ressemblances entre la biogénèse des miARN et celle des ARNm. Le modèle actuel de production des miARN propose que la polymérase à ARN II (POLII) soit responsable de la transcription du miARN; comme c'est le cas pour la majorité des transcrits d'ARN messagers (ARNm) (Cai, Hagedorn et al. 2004, Lee, Kim et al. 2004) (voir Figure 2-‐2). Le produit de cette transcription est nommé le transcrit primaire de miARN (pri-‐miARN). Ce transcrit contient une coiffe et queue de polyadénylation (Cai, Hagedorn et al. 2004), comme c'est le cas pour les ARNm. Ce long transcrit primaire dont la taille peut atteindre six kilo bases (kb) mais est généralement retrouvée entre trois et quatre kb (Saini, Griffiths-‐Jones et al. 2007) est ensuite clivé par un complexe protéique nommé le microprocesseur. Celui-‐ci est composé, entre autres, de la ribonucléase DROSHA et de son co-‐facteur DGCR8 (Lee, Ahn et al. 2003). Plusieurs autres protéines sont retrouvées dans ce complexe dont les hélicases de type DEAD-‐ box p68 et p72 et des ribonucléoprotéines (Fukuda, Yamagata et al. 2007, Guil and Caceres 2007). La protéine DGCR8 est responsable du positionnement du microprocesseur sur le pri-‐miARN alors que Drosha effectue le clivage (Lee, Ahn et al.
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 N o m b re d e p u b lic ati o n s p ar an n ée (n o n c u m u la ti f)
16
2003, Han, Lee et al. 2006). Ce clivage donne naissance au précurseur de miARN (pre-‐ miARN), une tige-‐boucle dont la taille est d'environ 70 nucléotides (nt) (Liu, Fortin et al. 2008).
Figure 2-‐2 Biogénèse des miARN
Le gène de miARN est transcrit par POLII pour donner naissance au pri-miARN. Celui-ci est ensuite clivé par DROSHA en une tige boucle d'environ 70 nt qui est exportée au cytoplasme par la protéine Exportin5 (EXP5). La tige boucle est ensuite clivée par DICER en un double brin d'ARN dont un des brins est incorporé au complexe de silencement par la protéine AGO2.
Un mécanisme alternatif de génération du pre-‐miARN est celui des mirtrons, utilisé pour produire certains miARN introniques. Lors de l'épissage alternatif de l'ARNm, l'intron contenant le mirtron forme une tige-‐boucle qui sert directement de pre-‐ miARN sans nécessiter d'autres formes de maturation. Ce mécanisme ne requiert donc
pas le complexe protéique contenant DROSHA et DGCR8. Ce mécanisme a tout d'abord été identifié chez la drosophile (Okamura, Hagen et al. 2007) puis chez l'humain où, notamment, miR-‐877 et miR-‐1224 sont produits ainsi (Berezikov, Chung et al. 2007). Le pre-‐miARN obtenu de l'un ou l'autre mécanisme est ensuite exporté vers le cytoplasme par la protéine exportin-‐5 (EXP-‐5) (Yi, Qin et al. 2003, Bohnsack, Czaplinski et al. 2004, Lund, Guttinger et al. 2004) où il est clivé à nouveau par la protéine Dicer (DCR), une ribonucléase III (Bernstein, Caudy et al. 2001, Ketting, Fischer et al. 2001, Knight and Bass 2001). Le domaine PAZ de DCR lui permet de reconnaître le surplomb simple brin à l'extrémité 3' du pre-‐miARN (Song, Liu et al. 2003, Ma, Ye et al. 2004) alors que ses domaines RNAse III permettent le clivage à environ 21 nt du domaine PAZ. Ce clivage génère un autre surplomb simple brin et donc le résultat est un double brin d'ARN dont la taille est celle du miARN mature additionnée d'un surplomb de deux nt à chaque extrémité 3' du double brin (Bartel 2004). Dépendamment du contexte cellulaire (Ro, Park et al. 2007) ou de déterminants de séquences ou de structures (Khvorova, Reynolds et al. 2003, Schwarz, Hutvagner et al. 2003, Griffiths-‐Jones, Hui et al. 2011, Yang, Phillips et al. 2011), l'un ou l'autre (ou les deux) de ces deux brins est (sont) ensuite incorporé(s) à un complexe protéique effectif, nommé RISC (pour Rna Induced Silencing Complexe), contenant entre autres, une protéine AGO.
L'hybridation du complexe RISC à sa cible sur l'ARNm mène à une diminution d'expression de la protéine. Cette diminution d'expression peut être due à une déstabilisation de l'ARNm suite à la déadénylation de la queue polyA. La traduction de l'ARNm peut elle même être affectée par un blocage de l'initiation ou de l'élongation de la traduction ou encore par la protéolyse du peptide nouvellement formé (Filipowicz, Bhattacharyya et al. 2008) Plus rarement chez les vertébrés, il est possible que le miARN mène au clivage de l'ARNm (Liu, Carmell et al. 2004).
Les régions caractérisées comme cibles de miARN se retrouvent principalement dans les régions 3'UTR des ARNm. Cependant, la caractérisation à grande échelle de toutes
18
les cibles de miARN a montré que les régions codantes sont presque autant ciblées que les régions 3'UTR. Cette étude a aussi montrée que les autres régions génomiques, dont font partie entre autre les régions 5'UTR, les régions intergéniques et les introns sont ciblées par les miARN (Chi, Zang et al. 2009). Une multitude d'évidences expérimentales indiquent que la région amorce ("seed") du miARN, soit les nucléotides en position deux à huit à l'extrémité 5' du miARN, doit être parfaitement ou presque parfaitement complémentaire à la cible pour mener à un effet du miARN sur celle-‐ci (Doench and Sharp 2004, Kloosterman, Wienholds et al. 2004, Brennecke, Stark et al. 2005). Cette spécificité de seulement sept nucléotides signifie qu'en moyenne, tous les 16kb du génome contiennent une cible potentielle de chaque miARN possible (47=16384).