5 Travaux de recherche connexes 87
6.1 Résumé des principaux résultats de recherche 152
6.1.2 Modélisation des interactions miARN/ARNm 156
Dans le cadre de la deuxième approche de modélisation, l'intérêt était centré sur les interactions entre les miARN et les ARNm. Ces travaux ont permis d'élaborer un modèle prédisant quels ARNm sont touchés par l'augmentation ou la diminution d'un miARN. Similairement, le modèle proposé permet de prédire les effets, à travers le réseau de miARN, du changement d'un ARNm sur tous les autres ARNm. Nous avons également pu émettre l'hypothèse que les miARNs peuvent modifier un groupe fonctionnel de gènes. Le modèle développé lors de ces travaux est unique et ses prédictions ne peuvent être faites par aucun autre outil existant.
Cette amélioration dans la précision des prédictions est due à un important changement de paradigme. Les résultats des premiers travaux de recherche de cibles
de miARN semblaient montrer que lorsqu'un miARN cible un ARNm donné dans un contexte donné, alors il le cible dans tous les contextes et chez toutes les espèces. Des travaux plus récents indiquent par contre que ceci n'est pas toujours le cas. Le nouveau paradigme qui a été développé pour la deuxième modélisation est basé sur l'hypothèse qu'un miARN peut cibler des ensembles différents d'ARNm dans des contextes différents. Ce changement de paradigme a mené à la considération des quantités de miARN et d'ARNm dans la prédiction des cibles de miARN. Le fait que la précision des prédictions augmente avec ce changement de paradigme et des évidences expérimentales récemment publiées (Khan, Betel et al. 2009, Arvey, Larsson et al. 2010, Mukherji, Ebert et al. 2011) supportent l'hypothèse à la base de celui-‐ci. Les conséquences de ces travaux de recherche sont importantes.
Cette modélisation met tout d'abord en évidence la dépendance des cibles d'un miARN au contexte cellulaire définit par la quantité de chacun des miARN et des ARNm. Ce phénomène a également été observé par d'autres équipes (Arvey, Larsson et al. 2010, Mukherji, Ebert et al. 2011, Bossel Ben-‐Moshe, Avraham et al. 2012). En d'autres mots, ces résultats impliquent qu'une cible de miARN dans un contexte ne l'est pas nécessairement dans un autre contexte. Il convient donc d'être circonspect lors de l'extrapolation de résultats expérimentaux réalisés dans un contexte vers un autre contexte. Cette dépendance au contexte cellulaire implique également qu'une observation faite dans une lignée cellulaire peut très bien ne pas être reproductible dans des cellules primaires puisque celles-‐ci représentent des contextes très différents d'une lignée cellulaire. Dans le même ordre d'idée, une observation faite chez la souris ne peut être facilement extrapolée à l'être humain, entre autres parce que les régions 3'UTR, des régions hautement ciblées par les miARN, ne sont généralement pas bien conservées entre les espèces. Dans un contexte de développement de thérapies basées sur le mécanisme d'action des miARN, il semble qu'il soit difficile de définir un bon système dans lequel réaliser les tests préliminaires. Cette dépendance implique également qu'une modification du contexte cellulaire, qu'elle soit naturelle (comme dans le cas de différenciation cellulaire) ou artificielle
158
(par modifications des quantités de miARN ou d'ARNm dans le cadre d'expériences) mène à une réorganisation parfois très importante de l'association miARN/ARNm. Cette réorganisation signifie que l'analyse et la compréhension des résultats expérimentaux après modification du contexte cellulaire peut être ardue, voire impossible sans la connaissance du réseau d'interactions présent avant et après la modification. Il convient également de noter que cette réorganisation mène souvent à des effets secondaires sur certains ARNm. C'est le cas, par exemple, lorsque l'augmentation d'un miARN fait en sorte que celui-‐ci cible un ARNm à un endroit qui serait, sinon, ciblé par un autre miARN. Cet autre miARN cible alors un ARNm qui ne serait pas ciblé si l'augmentation du premier miARN n'avait été faite. L'observateur ne perçoit alors que la diminution du deuxième ARNm et conclut donc, à tort, que celui-‐ci est une cible du premier miARN alors que la véritable cible de ce miARN, à la base de cet effet secondaire, ne diminuant pas n'est donc pas observée. Il est cependant possible de séparer les effets directs des effets secondaires lorsque l'analyse des résultats expérimentaux est faite en combinaison de l'analyse des résultats de la même expérience faite virtuellement.
Le changement de paradigme nécessaire à la modélisation des interactions miARN/ARNm nécessite une quantification de chacun des miARN et ARNm. Pour obtenir ces quantités, nous avons utilisé les données publiques de micro-‐puces. Plusieurs problèmes connus sont associés à cette technologie. Tout d'abord, la quantification relative des divers ARNm est biaisée par la longueur de ceux-‐ci. Ce problème n'est pas présent dans la quantification des miARN puisque ceux-‐ci présentent tous sensiblement la même longueur. Ensuite, avec cette technologie, il n'est possible de quantifier que ce qui est connu. Ce problème est particulièrement criant dans le cas des micro-‐puces de miARN puisque de nouveaux miARN sont régulièrement isolés. Une solution à ce problème est d'utilisé des données de séquençage à haut débit qui peuvent identifier, dans un échantillon, des ARN encore inconnus. Par contre, la petite taille des miARN pose encore quelques difficultés techniques lors du traitement informatique des données de séquençage, entre autres
parce qu'il est difficile de départager un miARN inconnu faiblement exprimé de divers produits de dégradation de l'ARN. De plus, peu de jeux de données sont présentement disponibles où un même type cellulaire a été séquencé autant pour les ARNm que pour les miARN, idéalement sur la même plateforme.
Un autre problème, présent autant dans les résultats obtenus par micro-‐puce que par séquençage à haut débit est que ces expériences ne donnent que des données relatives d'un ARN par rapport aux autres. Dans notre modélisation, il serait possible de n'utiliser que des données relatives. Cependant, les deux techniques de quantification ne peuvent être faites simultanément pour les ARNm et les miARN. Les ARNm sont typiquement isolés par sélection des transcrits polyadénylés, ce qui permet d'éliminer les ARNr et les ARNt qui sont tellement abondants qu'il ne serait pas possible d'obtenir de bons résultats de quantification des ARNm sans cette étape. Cependant, les miARN ne possèdent pas cette caractéristique et doivent donc être isolé par une sélection basée sur la taille de ceux-‐ci. Au final, deux expériences différentes doivent donc être faites pour quantifier les ARNm et les miARN ce qui donne deux ensembles de quantifications relatives. Pour notre modélisation, ces quantifications relatives doivent être ramenées dans un même espace comparable et doivent donc être transformées (par exemple en quantifications absolues soit en nombre de copies par cellules) en considérant, entre autre, la quantité d'ARN utilisé, l'efficacité de la réaction de transcription inverse et la quantité d'ARN dans une cellule du type cellulaire à l'étude.
La modélisation faite ici prédit ce qui se passerait si une cellule ayant exactement les quantités d'ARN tel que défini dans les données d'entrées. Cependant, toutes les cellules ne sont pas absolument identiques. Pour représenter cette diversité, il serait intéressant de faire varier les quantités de chacun des transcrits (de ±10% par exemple) et de moyenner les effets de plusieurs dizaines de modélisation. Ceci permettrait d'obtenir des prédictions plus robustes.
160
L'un des problèmes les plus importants de la prédiction de cibles de miARN est qu'il est présentement difficile d'établir l'étendue du nombre de cibles effectivement utilisées par la cellule. Ce problème sera peut être contré par le développement de méthodes expérimentales permettant de déterminer de façon directe, précise et rapide toutes les cibles d'un miARN. Une variante de la technique du PAR-‐CLIP (qui ne permet pas d'assigner un miARN spécifique à un site de liaison de miARN identifié sur un ARNm) qui utiliserait des anticorps reconnaissant spécifiquement un miARN pourrait remédier à ce problème et fournir des jeux de données complets avec lesquels tester et améliorer les outils de prédictions de cibles de miARN.