• Aucun résultat trouvé

CHAPITRE 1 : INTRODUCTION

2. Les microARNs

2.4. Stratégies expérimentales pour l’identification de cibles moléculaires

2.4.1. Stratégies basées sur le profilage

Dans les stratégies basées sur le profilage, le gain ou la perte de fonction d’un miR sont généralement atteints par l'expression exogène (surexpression) ou l'inhibition endogène du miR.

Une surexpression peut être obtenue par transfection transitoire d'un mimétique (c’est-à-dire un pré-miR synthétique qui permet de mimer l’action des miRs naturels) ou par introduction stable, typiquement à l’aide d’un vecteur lentiviral, d'une construction exprimant le gène du miR (Thomson, Bracken et al. 2011). Malgré une utilisation répandue, les expériences de surexpression de miRs peuvent générer des résultats faussement positifs dus aux taux des miRs supra-physiologiques généralement obtenus après transfection transitoire (Bracken, Gregory et al. 2008). En effet, bien qu'une grande partie du miR transfecté ne soit pas incorporée dans les complexes RISC pour être fonctionnellement active, cela peut être considérablement plus élevé que la fourchette de 20-30% dans laquelle de nombreux miRs endogènes fluctuent pour moduler l'expression génique (Hobert 2007). Cette surexpression trop élevée peut potentiellement saturer les complexes RISC où le mimétique peut déplacer les miRs endogènes. Cela peut amener au ciblage d’ARNm qui ne seraient pas nécessairement visés dans un contexte plus physiologique (Khan, Betel et al. 2009). Un autre élément à prendre en compte est la structure des mimétiques. En effet, les mimétiques sont typiquement des duplex synthétisés chimiquement qui sont conçus dans le but d'activer seulement un brin du miR. Le brin passager n’est pas nécessairement identique à la forme physiologique de ce dernier et il existe toujours la possibilité que ce brin soit incorporé dans le complexe RISC, où il peut induire des effets secondaires. Une autre considération est que les expériences de surexpression sont couramment réalisées dans un environnement cellulaire artificiel où les cibles naturelles peuvent ainsi manquer, alors que d'autres cibles normalement non co-exprimées avec le miR peuvent être détectées (Thomson, Bracken et al. 2011).

Les problèmes inhérents à la surexpression des miRs peuvent être évités en utilisant l’inhibition des miRs. En effet, avec cette stratégie, il est possible de réduire le niveau du miR dans des limites physiologiques. L'inhibition du miR peut être obtenue de plusieurs façons (Steinkraus, Toegel et al. 2016). Le plus souvent, il s’agit d’une

expression d’oligonucléotides antisens modifiés, appelés antimiRs, capables de lier des miRs matures et de bloquer leurs activités (Thomson, Bracken et al. 2011). Cependant, l'inhibition d’un miR, obtenue par des oligonucléotides antisens, peut être peu spécifique. Par exemple, cette approche peut ne pas distinguer les membres de la même famille de miRs ayant des séquences similaires. Il faut également tenir compte du fait que les oligonucléotides antisens peuvent séquestrer des miRs endogènes sans favoriser leur dégradation. Cela signifie que la quantification de miRs par qRT-PCR ne mesurera pas une diminution des niveaux de miR après son inhibition, ce qui rend difficile la détermination de l'efficacité de l'oligonucléodite antisens (Thomson, Bracken et al. 2011).

Les stratégies d'inhibition et de surexpression ont été comparées dans une étude sur le miR-140. Dans cette expérience, les changements d'abondance du miR après l’inhibition n'étaient pas aussi importants que dans un modèle de surexpression, bien que les cibles d’ARNm identifiées étaient biologiquement plus pertinentes (Tuddenham, Wheeler et al. 2006).

Les stratégies basées sur le profilage (Tableau 2) utilisent l’analyse transcriptomique (puces à ADN ou Microarrays et ARN-seq), l’analyse protéomique (2D-DIGE et SILAC) et l’analyse de la traduction (profilage des polysomes et profilage des ribosomes). Conceptuellement, toutes ces stratégies se basent sur une analyse comparative de l'expression génique à la suite de la surexpression ou l'inhibition d’un miR candidat.

2.4.1.1. Profilage transcriptomique

2.4.1.1.1. Les puces à ADN ou Microarrays

Initialement, les stratégies d'analyse comparative d'expression génique se basaient surtout sur le profilage du transcriptome par Microarrays. Une des études pionnières utilisant cette technologie a démontré, dans les cellules HeLa, qu’un seul miR (miR-124) pouvait réduire les niveaux d’une centaine d'ARNm de gènes différents (Lim, Lau et al. 2005). Dans cette technique, des séquences d'ADN spécifiques à des gènes, appelées sondes, sont déposées ou synthétisées sur une matrice de manière covalente ou non covalente. Cela permet d’analyser des échantillons d'acides nucléiques marqués,

les cibles, qui vont se lier (par hybridation) aux sondes de la matrice. Cette liaison est utilisée pour mesurer les concentrations des acides nucléiques en solution.

Dans le but de réaliser une analyse comparative de l’expression génique entre deux échantillons, par exemple des cellules traitées avec un mimétique et des cellules contrôles, l’analyse de Microarrays utilisée est celle à deux canaux. Cette technique permet la comparaison de deux échantillons grâce au marquage par deux fluorophores différents et se base sur le principe d'hybridation compétitive.

Plus précisément, dans une expérience de Microarrays à deux canaux, l'ARN est extrait des cellules d'intérêt et converti en ADN complémentaire (ADNc) par transcription inverse. Ensuite, l’ADNc, qui provient des cellules contrôles, est marqué en utilisant un fluorophore d’une certaine couleur (par exemple vert), pendant que l’ADNc provenant des cellules traitées est marqué en utilisant un marqueur d’une autre couleur (par exemple rouge). L’ADNc marqué est ensuite hybridé à la matrice contenant les sondes. Après lavage de la matrice, un laser excite les fluorophores pour produire de la lumière qui est détectée par un scanner. Ce dernier génère une image numérique qui est ensuite traitée par un logiciel spécialisé pour la transformer en information numérique. Ces informations vont ensuite permettre d’obtenir un ratio de l'abondance relative de la séquence cible d'un échantillon traité (marqué avec le fluorochrome rouge) par rapport à un échantillon de référence (marqué avec le fluorochrome vert). Le ratio est spécifique à chaque sonde utilisée et donc à chaque gène. De cette façon, il est possible d’analyser les changements d’expression génique globaux dans un échantillon test par rapport à l’échantillon contrôle.

Les Microarrays demeurent toujours très utilisés pour le profilage du transcriptome, en particulier dans la recherche sur le cancer (Benderska, Dittrich et al. 2015, Fujita, Kojima et al. 2015). Cependant, cette technique présente certaines limites. Celles-ci comprennent : des artéfacts d'hybridation, l'hybridation croisée et des problèmes de détection des fluorophores (Okoniewski and Miller 2006, Casneuf, Van de Peer et al. 2007).

Récemment, la mise au point des approches d’ARN-seq a permis d’accéder à des niveaux de spécificité et de sensibilité d’analyse transcriptomique plus élevés. En effet, l’ARN- seq est une méthode plus précise et elle est capable de détecter une large gamme de

niveaux d'expression. Cette capacité est d’une importance capitale pour la recherche des cibles de miRs, puisque les miRs ont tendance à effectuer une régulation relativement fine sur la plupart de leurs cibles (Xu, Fewell et al. 2010).

2.4.1.1.2. Le séquençage de l’ARN ou ARN-seq

Contrairement aux Microarrays, l’ARN-Seq détermine directement la séquence de l'ADNc grâce aux techniques de séquençage. Cette technologie utilise le séquençage à haut débit ou NGS (Next-Generation Sequencing). Le NGS est une méthode produisant des millions de séquences, à faible coût, afin d’identifier et quantifier l'ARN issu de la transcription du génome à un moment donné (Chu and Corey 2012).

Une expérience d’ARN-Seq typique (Figure 12a) consiste tout d’abord à isoler l'ARN du matériel biologique de choix (par exemple des cellules contrôles et des cellules traitées avec un mimétique ou un inhibiteur de miR). À cette étape, il est possible de sélectionner un sous-ensemble de molécules d'ARN, par exemple celles qui ont un poly-A (transcrits polyadénylés), grâce à des protocoles spécifiques. Ensuite, ces ARNs sont convertis en ADNc pour la création d’une banque de séquençage. À la suite d’une amplification par PCR, chaque molécule d’ADNc est séquencée pour obtenir des séquences courtes, appelées « reads ». Les reads vont généralement de 30 à 400 paires de bases, selon la technologie de séquençage de l'ARN utilisée. Après le séquençage, les reads sont alignées sur un génome de référence et l’expression des transcrits est quantifiée. Enfin, pour l'analyse comparative de l'expression des transcrits dans les deux conditions, différentes méthodes statistiques peuvent être appliquées (Huang, Niu et al. 2015). L’analyse transcriptomique (par Microarrays ou ARN-Seq) est très utile pour étudier les transcrits affectés par un miR. En même temps, une partie de l'activité d’un miR est médiée au niveau de la traduction (Baek, Villen et al. 2008, Thomson, Bracken et al. 2011) : pour cette raison, des analyses de profilage protéomique ont été développées.

2.4.1.2. Profilage protéomique

2.4.1.2.1. 2D-DIGE

Une stratégie traditionnelle pour la quantification des changements d'expression au niveau protéique global est l’électrophorèse bidimensionnelle différentielle sur gel ou 2D-DIGE (2-Dimensional Differential Gel Electrophoresis) qui compare deux protéomes marqués par fluorescence. Cette comparaison passe d'abord par une séparation des molécules selon le point isoélectrique, puis selon le poids moléculaire. Les zones du gel qui présentent des différences de niveaux de fluorescence sont excisées et analysées par spectrométrie de masse. La spectrométrie de masse est une technique qui permet l’identification des molécules d’intérêt par mesure de leur masse. Cette approche a été utilisée pour identifier les cibles du miR-21 (Zhu, Si et al. 2007, Schramedei, Morbt et al. 2011) et du miR-210 (Fasanaro, Greco et al. 2009) dans des cellules en culture après inhibition ou surexpression de miRs. Cette approche est également applicable aux échantillons de tissus, comme en témoigne l'identification des complexes miR-cibles dans les reins de rats (Tian, Greene et al. 2008).

2.4.1.2.2. SILAC

Le marquage isotopique stable des acides aminés en culture cellulaire ou SILAC (Stable Isotope Labeling by Amino Acids in cell culture) est une autre approche de profilage protéomique basée sur la spectrométrie de masse. Le SILAC détecte les différences d'abondance protéique entre deux échantillons en utilisant un marquage isotopique non radioactif (Ong, Blagoev et al. 2002). Brièvement (Figure 12b), deux populations de cellules sont cultivées, dont une est maintenue dans un milieu de croissance contenant des acides aminés normaux. La seconde population est maintenue dans un milieu de croissance contenant des acides aminés marqués avec des isotopes lourds stables (non radioactifs). Par exemple, le milieu peut contenir de l'arginine marquée avec six atomes de carbone 13 (13C) au lieu du carbone normal 12 (12C). Lorsque les cellules poussent dans ce milieu, elles incorporent l'arginine lourde dans toutes leurs protéines. Par la suite, tous les peptides contenant une seule arginine sont plus lourds de 6 Daltons que les peptides normaux. Les protéines des deux populations cellulaires peuvent être combinées et analysées ensemble par spectrométrie de masse. En effet, cette technique, en se basant sur la différence de masse, peut distinguer des paires de peptides qui sont chimiquement identiques, mais qui présentent différentes compositions d'isotopes stables. Le rapport entre les intensités de pic de ces paires de peptides reflète le rapport d'abondance entre ces deux protéines. L’approche SILAC a été beaucoup utilisée pour étudier l'effet des miRs sur les niveaux de protéines dans

diverses lignées cellulaires cancéreuses humaines (HeLa, HEK293T, MiaPaCa2 et différentes cellules cancéreuses colorectales) (Vinther, Hedegaard et al. 2006, Yang, Chaerkady et al. 2010, Kaller, Liffers et al. 2011, Lossner, Meier et al. 2011, Liu, Halvey et al. 2013). Cependant, une limitation importante de l’approche SILAC est qu'elle est seulement applicable aux cellules qui peuvent être cultivées pendant au moins quelques cycles de réplication afin de permettre l'incorporation d'acides aminés marqués.

Des approches intégrées, comparant les données transcriptomiques et protéomiques, sont fréquemment utilisées pour distinguer les cibles des miRs qui sont réprimées au niveau traductionnel de celles qui sont régulées par la déstabilisation de l'ARNm. Cependant, les approches protéomiques sont en général moins sensibles dans le cas des protéines très abondantes et solubles. Par conséquent, la corrélation des données d'expression de l'ARN (Microarrays ou ARN-Seq) aux données d'expression protéique (spectrométrie de masse) n'est pas toujours explicite. Alors, des technologies de profilage de la traduction, plus sophistiquées et plus fiables, ont été développées comme alternatives aux approches de profilage protéomiques (Piccirillo, Bjur et al. 2014). Ces techniques, qui mesurent l’efficacité de la traduction, analysent la conséquence fonctionnelle de la liaison d’un miR à ses cibles.

2.4.1.3. Profilage de la traduction

2.4.1.3.1. Profilage polysomique

Le profilage polysomique est une méthode utilisée pour différencier l'impact des miRs sur la traduction par rapport à la stabilité de l'ARNm. Cette technique est utilisée pour étudier l'association des ARNm avec les ribosomes. En particulier, elle mesure le nombre d'ARNm liés par au moins un ribosome (occupation des ribosomes) ainsi que le nombre moyen de ribosomes pour 100 paires de base (densité des ribosomes). Dans cette méthode, les cellules sont traitées avec de la cycloheximide pour arrêter la traduction des ribosomes avant la lyse cellulaire. Les ARNm liés au ribosome sont ensuite séparés de la fraction non liée par ultracentrifugation en gradient de saccharose et quantifiés par Microarrays.

2.4.1.3.2. Profilage des ribosomes

Une autre technique qui évalue l'efficacité de la traduction, développée pour évaluer l'effet des miRs sur la production de protéines, est le profilage des ribosomes (Figure 11c). Cette technique est une version avancée du profilage des polysomes dans laquelle la technique des Microarrays est remplacée par l’ARN-seq. Dans cette technique, à la suite au traitement avec la cycloheximide, l'ARN est purifié à partir d'extraits cellulaires et digéré par la ARNase I pour obtenir des fragments de ribosomes uniques (monosomes) liés à l'ARN. Une étape de traitement à la protéinase K libère les fragments d'ARN liés, qui peuvent être utilisés pour la préparation de banques de séquençage d’ADNc et pour le séquençage à haut débit (Figure 11c). Le profilage des ribosomes permet de quantifier le nombre de ribosomes liés à un seul ARNm et d'établir la position exacte de chaque ribosome sur l’ARNm (Ingolia 2014).

Le problème principal des technologies basées sur le profilage réside dans leur incapacité à discriminer les cibles de miRs directes et indirectes. Pour cette raison, un certain nombre d'approches ont été développées pour l’analyse directe de complexes miR- ARNm. Ces approches se basent sur le fait que l'association entre les miRs et leurs cibles est médiée par le complexe RISC. En effet, la plupart de ces stratégies se basent sur l'immunoprécipitation (IP) des composants du complexe RISC. Cette IP a pour but de précipiter les miRs et leurs cibles associées, qui sont ensuite identifiées et analysées Microarrays ou ARN-seq.

Figure 12 : Stratégies d'identification expérimentale des cibles des miRs basées sur le profilage. (a) Schéma d’une expérience d’ARN-Seq : l'ARN est isolé à partir de cellules contrôles et de cellules traitées avec un mimétique ou un inhibiteur du miR (+/- miR). L’ARN est ensuite converti en ADNc pour la création d’une banque de séquençage. À la suite d’une amplification par PCR et du séquençage à haut débit (NGS), les séquences sont alignées au génome de référence. (b) Schéma d’une expérience SILAC : les cellules contrôles sont cultivées dans un milieu de croissance contenant des acides aminés normaux (N), tandis que les cellules traitées avec un mimétique ou un inhibiteur de miR (+/- miR) sont cultivées dans un milieu de croissance contenant des acides aminés marqués avec des isotopes lourds stables ou H (Heavy). À la suite de la lyse cellulaire et de la séparation sur gel, la spectrométrie de masse distingue les peptides chimiquement identiques, mais qui présentent des différences de compositions en isotopes stables. (c) Schéma d’une expérience de profilage de ribosome : à la suite du traitement avec la cycloheximide, l'ARN est isolé et digéré pour obtenir des monosomes liés à l'ARN. Enfin, le traitement à la protéinase K libère les fragments d'ARN, qui sont ensuite séquencés par séquençage à haut débit (NGS). Adapté de (Steinkraus, Toegel et al. 2016).

2.4.2.

Technologies basées sur la capture des complexes miRs-cibles