• Aucun résultat trouvé

Le criblage par ARNi à large échelle

1.3 ARNi et génomique fonctionnelle

1.3.2 Le criblage par ARNi à large échelle

À l’instar du criblage génétique (une méthode de « forward genetics »), le criblage par ARNi est une technique dite de génétique inverse (« reverse genetics »); c’est-à-dire que cette approche utilise comme point de départ un gène dont la séquence est généralement connue pour ensuite l’associer à un phénotype. Les approches de génétique inverse impliquent généralement une perturbation de l’activité du gène; dans le cas de l’ARNi, il s’agira d’en réduire l’expression. Tout comme le criblage génétique, le criblage par ARNi à large échelle est rapidement apparu comme étant un puissant outil d’annotation fonctionnelle des gènes. D’ailleurs, grâce à sa relative aisance d’emploi chez la drosophile et le ver, il pourrait être considéré comme le successeur du criblage génétique. En réalité, dû à leurs différences et aux limitations qui leur sont propres, il serait probablement plus juste de les considérer comme deux techniques complémentaires.

1.3.2.1 Utilisation de l’ARNi chez Drosophila melanogaster

En 1998, Fire et Mello avaient établi les bases de la technique d’ARNi chez C. elegans (Fire, Xu et al. 1998). Peu de temps après, la technologie fut introduite chez la drosophile où il fut démontré que des longs ARN à double brin (« ARNdb ») pouvaient réduire l’expression de gènes dans des cellules S2 en culture (Clemens, Worby et al. 2000). Le modèle S2 s’est rapidement illustré comme étant un système particulièrement bien adapté à l’ARNi, principalement grâce à la capacité des cellules en culture d’absorber directement les ARNdb sans l’aide d’agents de transfection. De plus, l’ARNdb est considérablement plus facile et moins dispendieux à générer que les petits ARN interférents (« siRNA ») et les petits ARN en épingle à cheveux (« shRNA »), couramment utilisés dans d’autres modèles. Or, l’ARNdb n’est généralement pas utilisé chez les vertébrés, puisqu’il induit une réponse immune médiée

par les interferons (Karpala, Doran et al. 2005). Suite à l’absorption dans le milieu cytoplasmique, l’ARNdb est découpé en petits fragments siRNA de 20-25 nt. Un des brins sera alors chargé sur le complexe de silençage induit par l’ARN, dit le complexe RISC (« RNA-induced silencing complex ») et servira de matrice pour guider le complexe vers les ARN messagers (« ARNm ») portant une séquence correspondante. Les molécules d’ARNdb ont généralement une longueur entre 200 et 600 nt, permettant de générer un assortiment de siRNA et d’augmenter l’efficacité de l’effet de déplétion souhaité (Ramadan, Flockhart et al. 2007).

1.3.2.2 Criblage à large échelle par ARNi

La découverte de l’ARNi chez le ver et sa première utilisation chez la mouche a lieu en parallèle de la publication des génomes de ces deux organismes (Consortium 1998, Adams, Celniker et al. 2000). Il s’agit d’une coïncidence fortuite, rendant possible et très facile de cibler tout gène d’intérêt dans ces organismes. De plus, il devint désormais possible d’envisager la création de banques d’ARNi couvrant l’ensemble du génome. D’ailleurs, les premières collections d’ARNi servant au criblage à large échelle virent le jour peu de temps après. Chez C. elegans, des collections de bactéries E. coli portant des plasmides producteurs d’ARNdb ont été générées (Kamath, Fraser et al. 2003). Les collections d’ARNdb pan- génomiques servant à la déplétion en culture cellulaire suivirent rapidement chez la mouche (Boutros, Kiger et al. 2004). Très rapidement, on constate le grand potentiel de ces approches à identifier un très grand nombre de gènes candidats. Chez le ver par exemple, les premiers criblages ARNi relient plus de gènes à des nouveaux phénotypes que l’ensemble des études de génétique classique menées depuis les 40 années précédentes (Zipperlen, Fraser et al. 2001, Nagy, Perrimon et al. 2003). Le criblage par ARNi apparait donc comme un outil de choix pour l’annotation fonctionnelle.

Chez la mouche, on constate la même aptitude à identifier rapidement une grande quantité de candidats dans les cribles ARNi. De plus, l’utilisation des ARNdb dans les cellules S2 présente de nombreux avantages pour le criblage. En effet, la possibilité d’induire l’ARNi simplement en ajoutant les ARNdb au milieu cellulaire facilite grandement l’exécution des expériences à large échelle et est particulièrement bien adaptée au format des plaques de

culture à 96 et 384 puits. Il est donc aisé d’augmenter le débit des expériences et même d’automatiser plusieurs étapes. De plus, le génome de mouche présente un taux de paralogie relativement faible, ce qui a comme avantage de réduire la robustesse phénotypique reliée à la redondance génique. La voie RAS/MAPK en est d’ailleurs un bon exemple comme on peut le voir dans le tableau 1.1.

De manière plus générale, le criblage par ARNi se révèle être un outil complémentaire au criblage génétique. La couverture plus systématique du génome et l’identification rapide des gènes candidats sont des avantages considérables et permettent de couvrir plus de terrain et ce, plus rapidement qu’avec la génétique classique. Par contre, l’ARNi ne produit pas un effet équivalent à la perte de fonction complète d’un gène. Cette caractéristique peut être un avantage lorsque la perte de fonction d’un gène causerait la létalité, une déplétion partielle permettant la survie et donc, l’étude productive du gène.

1.3.2.3 Limitations du criblage par ARNi

S’il est vrai que le criblage par ARNi présente de nombreux avantages par rapport au criblage génétique, cette technologie a toutefois des limitations qui lui sont propres. Bien que l’effet de déplétion partielle induit par l’ARNi puisse être un avantage dans certains cas, il peut également s’avérer être un inconvénient dans des cas où une déplétion complète serait requise pour générer un phénotype. De plus, l’identification rapide d’une grande quantité de candidats est un avantage impressionnant, mais cet avantage peut poser problème lorsque vient le temps de sélectionner le candidat le plus pertinent pour en faire une étude plus approfondie.

Les premières études de criblage menées chez la mouche étaient marquées par la présence d’une quantité importante de faux positifs. On se rendit rapidement compte que la présence de séquences partagées par plusieurs gènes dans les ARNdb des collections de première génération causait des effets de déplétion non-spécifiques (dits « off-target effects ») était une source considérable de résultats faux positifs (Kulkarni, Booker et al. 2006, Ma, Creanga et al. 2006, Dasgupta, Nybakken et al. 2007, Moffat, Reiling et al. 2007). Une séquence partagée aussi petite que 20 nt présente dans un ARNdb est en mesure de dépléter un ARNm distinct de sa cible initiale. De plus, certaines séquences répétées (telles que les

répétitions de type CAN) sont présentes dans de nombreux gènes et augmentent considérablement le nombre de cibles potentielles d’un ARNdb qui en contiendrait.

Vu ces limitations, il est vite devenu clair que cette technologie ne pourrait pas remplacer entièrement le criblage génétique. De plus, la promesse d’une annotation fonctionnelle rapide et compréhensive du génome serait beaucoup plus difficile que ce qui avait été envisagé initialement (Mathey-Prevot and Perrimon 2006).

1.3.2.4 Évolution du criblage par ARNi

Depuis la réalisation des premiers cribles ARNi, plusieurs améliorations ont permis de faire progresser cette technologie. Afin d’adresser le problème majeur des faux positifs dus aux séquences non-spécifiques, il est maintenant monnaie courante de valider tous les résultats de criblage avec une, voire plusieurs, sondes ARNdb non-chevauchantes. De plus, les librairies ARNi de deuxième génération sont composées d’ARNdb optimisés in silico pour contenir le moins de séquences non-spécifiques possible (Arziman, Horn et al. 2005, Horn, Sandmann et al. 2010). Pour les rares gènes où il n’est pas possible de générer des sondes spécifiques, les effets hors cible prédits sont annotés et peuvent être intégrés dans l’analyse post-criblage.

Une autre avancée importante est le développement d’outils permettant la validation via l’expression d’ARNm résistants, qui peuvent être employés à relativement large échelle (Kondo, Booker et al. 2009, Kondo and Perrimon 2011). L’évolution de technologies d’édition du génome, tel le CRISPR (« clustered regularly interspaced short palindromic repeats »), offre davantage de possibilités lors de la validation de résultats de criblages ARNi (Mohr, Smith et al. 2014). Des collections de mouches ARNi sont maintenant disponibles (Dietzl, Chen et al. 2007, Ni, Markstein et al. 2008) et permettent non seulement de passer rapidement de la culture cellulaire à l’organisme entier, mais également de procéder au criblage à large échelle par ARNi ciblés dans des tissus spécifiques (Mummery-Widmer, Yamazaki et al. 2009).

Un problème important dans le domaine du criblage ARNi était l’absence d’outils d’analyse et de méthodes standardisées de traitement des données, un constat surtout très apparent lorsque qu’est faite la comparaison avec d’autres techniques expérimentales à large

échelle (Brazma, Hingamp et al. 2001, Knudsen, Daston et al. 2005, Taylor, Paton et al. 2007, Martinez-Bartolome, Binz et al. 2014). En 2006, malgré ses succès en tant qu’outil de génétique inverse, le criblage par ARNi n’avait pas encore atteint sa pleine maturité en tant que technique de biologie des systèmes due à ses lacunes (Mathey-Prevot and Perrimon 2006). Depuis, des approches combinées avec la protéomique et de criblage par ARNi ont montré que la combinaison de ces deux méthodes pouvait permettre une annotation fonctionnelle plus riche, ainsi qu’aider à la sélection des candidats (Miller, Lau et al. 2009, Friedman, Tucker et al. 2011, Vinayagam, Stelzl et al. 2011, Neumuller, Wirtz-Peitz et al. 2012, Vinayagam, Hu et al. 2013, Vinayagam, Zirin et al. 2014). D’autre part, la disponibilité d’outils de microscopie automatisée plus performants et d’outils d’analyse d’imagerie adaptés a permis l’émergence du criblage à haut contenu (« high content screening » ou « HCS »), où il est possible d’extraire des données multiparamétriques, permettant de cribler plusieurs phénotypes en parallèle et de mieux regrouper les facteurs similaires (Goshima, Wollman et al. 2007, Wang, Zhou et al. 2008, Fuchs, Pau et al. 2010). Finalement, on aura vu récemment l’émergence du criblage d’interaction génétique par ARNi chez la drosophile (Axelsson, Sandmann et al. 2011, Horn, Sandmann et al. 2011, Laufer, Fischer et al. 2014). Cette technique s’inspire des criblages d’interactions synthétiques à large échelle chez la levure et permet également d’identifier des groupes de gènes à fonction reliées. Nous avons employé une stratégie de criblage d’interaction génétique par ARNi pour identifier des facteurs reliés fonctionnellement à Usp47, une deubiquitinase régulant les niveaux protéiques de MAPK. Ces travaux ainsi que la technique de criblage sont décrits plus en détail au chapitre 4.

Des avancées importantes ont également eu lieu au plan des outils d’analyse et du traitement des données de criblage. Il existe maintenant plusieurs logiciels et outils disponibles pour chacune des étapes, allant de l’élaboration des ARNdb jusqu’à l’analyse des données (Boutros, Bras et al. 2006, Horn and Boutros 2010, Hu, Sopko et al. 2013). De plus, plusieurs ressources regroupent maintenant les données de cribles publiés, facilitant ainsi le minage de ces données (Tableau 1.II). Finalement, à défaut d’avoir des normes de standardisation bien définies, le fait que la majorité des criblages soient effectués dans quelques grands centres – principalement au Drosophila RNAi Screening Center, à Harvard – a permis une certaine standardisation des procédures et des réactifs employés.

Tableau 1.II Bases de données regroupant les données de cribles ARNi publiés (tiré de Mohr, Smith et al. 2014 avec la permission de Nature Publishing Group)

Documents relatifs