5 Travaux de recherche connexes 87
6.1 Résumé des principaux résultats de recherche 152
6.1.1 Modélisation des boucles de régulation miARN 152
La première approche de modélisation utilisée se rapporte aux boucles de régulation entre des miARN et des FT. Cette modélisation a permis d'identifier plus de 700 de ces boucles de co-‐régulation. Celles-‐ci jettent un nouvel éclairage sur l'étendue de la régulation par les miARN pour plusieurs raisons. Tout d'abord, le nombre de boules identifiées représente une augmentation significative par rapport à ce qui est rapporté dans la littérature. De plus, on observe une grande variété dans les FT identifiés formant ces boucles. Une partie importante de ceux-‐ci ont été caractérisés comme des FT clés dans divers systèmes. C'est le cas, notamment, de LMO2 qui possède un rôle important dans l'hématopoïèse.
Les résultats de la validation expérimentale de ces boucles ont permis, tout d'abord de supporter la précision de la méthode informatique utilisée. Ces résultats ont aussi permis d'assigner un rôle dans le destin cellulaire hématopoïétique à deux
de celles-‐ci impliquant le FT LMO2 et les miARN miR-‐223 et miR-‐363. Ces travaux de recherche ont également permis d'étendre le rôle hématopoïétique de LMO2 au maintient des cellules souches hématopoïétiques et à la détermination du destin cellulaire durant les premières étapes de l'hématopoïèse. Deux aspects du rôle de LMO2 qui étaient jusqu'alors inconnus.
Cette modélisation et la validation expérimentale qui l'a suivie constituent donc une preuve de concept de la possibilité d'assigner un rôle à un miARN à partir du rôle du FT avec lequel il forme une boucle de régulation. Dans le cas présent, l'hypothèse d'un rôle hématopoïétique pour miR-‐223 et miR-‐363 corrobore avec des évidences expérimentales obtenues par d’autres équipes de recherche. La modélisation apporte donc un élément additionnel supportant l'hypothèse de leur fonction hématopoïétique.
Cette modélisation permet donc de générer des hypothèses raisonnables sur la fonction de miARN, similairement à ce qu'un criblage des miARN exprimés spécifiquement dans certains tissus permettrait de faire. Cependant, la modélisation présente plusieurs avantages par rapport à un criblage. Tout d'abord, elle peut être faite sur tous les miARN et tous les FT connus à la fois. Ceci signifie que la quantité d'information obtenue est largement supérieure à ce qu'un criblage des miARN spécifiquement exprimés permettrait d'obtenir. Un autre avantage d'une telle modélisation est que l'avancement des connaissances, lorsqu'il est inclut dans la modélisation, permet de l'améliorer, alors qu'à l'inverse, un criblage devient rapidement désuet dès que notre compréhension d'un phénomène biologique est modifiée par de nouvelles données expérimentales. Étant donné ces caractéristiques, la modélisation est un outil de choix pour mieux comprendre la biologie moléculaire.
Dans un contexte où de plus en plus d'études sont faites pour utiliser le mécanisme d'action des miARN dans un but thérapeutique, il est primordial de bien le comprendre et de cerner son étendue. L'identification de boucles de régulations
154
miARN/FT est un pas de plus dans la compréhension de ce mécanisme. Cette compréhension est nécessaire afin d'utiliser ce mécanisme à son plein potentiel.
L'élaboration d'une thérapie qui utiliserait, par exemple, miR-‐223 afin de cible un gène X pourrait tirer bénéfice de l'existence de la boucle double négative entre miR-‐223 et LMO2. Selon cette boucle, l'augmentation de miR-‐223 par un apport extérieur mène entre autres à la diminution de LMO2, un régulateur négatif de l'expression de miR-‐223. Ceci mène subséquemment à l'augmentation des niveaux endogènes de miR-‐223, ce qui pourrait contribuer à rendre une thérapie utilisant ce miARN plus efficace. Par contre, cette même boucle, dans un contexte où l'expression de LMO2 est fortement positivement régulée pourrait mener à la diminution de miR-‐ 223 et annuler son effet thérapeutique potentiel.
La présence de boucles de régulation entre miARN et FT nous porte à croire que la cellule utilise tout ce qui est à sa disposition et recycle des éléments de régulation afin de produire une variété de comportements dans divers système en n'utilisant qu'un nombre limité de composantes. Par exemple, une boucle de régulation double négative, telles que celles identifiées lors de la première modélisation, permet de n'utiliser qu'un seul signal dans la gestion de l'expression inverse d'un miARN et d'un FT. Sans ce type de boucle de régulation, la cellule devrait probablement utiliser un régulateur pour le miARN, un autre pour le FT et un senseur pour ajuster les niveaux du miARN à ceux du FT (et vice-‐versa). L'utilisation d'une boucle de régulation semble une solution beaucoup plus efficace. De plus, ces boucles de régulations sont, selon toute vraisemblance, elle même dans des réseaux de régulation plus complexes. Ces réseaux de régulation sont hautement connectés; en particulier lorsque l'on considère les connections indirectes (par exemple, SCL régule LMO2 qui régule miR-‐223 et donc SCL régule indirectement miR-‐223). Le réel réseau de régulation utilisé par la cellule est donc probablement plus près d'une clique (au sens mathématique du terme) que d'un arbre de régulation. Hors, beaucoup de travail a été fait dans l'esprit des relations un à un, en voyant les réseaux d'interaction comme des graphs faiblement connectés et dont les signaux sont directionnels et ne
mènent qu'à peu ou pas de rétroaction plutôt que comme des cliques. Mes travaux de recherche m'amènent à croire qu'il faut maintenant penser en terme de relations plusieurs à plusieurs. Ceci nous mènera à revoir beaucoup de méthodes expérimentales utilisées et à remettre en question plusieurs des conclusions tirées. Il faut garder en tête que lorsque plusieurs règles sont nécessaires à l'explication de divers phénomènes reliés, il est possible qu'une règle plus complexe existe pour expliquer en même temps tous ces phénomènes. Cette règle est probablement celle à mettre en application. Mes travaux de recherche m'amènent à croire que la biologie se doit d'aller vers des hypothèses englobantes plutôt que de fractionner les phénomènes et de proposer des hypothèses et des explications différentes pour chaque sous phénomène.
Récemment, diverses études ont montrées qu'il est possible de reprogrammer des cellules différenciées en cellules pluripotentes en utilisant divers FT ou miARN. La connaissance de l'existence de boucles de régulation entres des FT et des miARN jouant un rôle dans cette reprogrammation pourrait être utilisée pour la faciliter. La connaissance et l'utilisation de ces boucles pourraient permettre l'utilisation de moins de facteurs (miARN ou FT) que ce qui a été utilisé. Ultimement, il serait possible de n'utiliser qu'un seul facteur clé qui, par l'entremise de ses boucles de régulation, permettrait d'augmenter ou de diminuer un ensemble d'autres facteurs. Ceux-‐ci, à leur tour, modifieraient un autre ensemble de facteurs. Ultimement, la toute première modification mènerait à une cascade dirigée d'autres modifications qui utiliseraient les systèmes de régulation de la cellule pour mener à la reprogrammation souhaitée. Ce genre de manipulation de la cellule n'est possible que si l'on connaît finement les divers réseaux de régulation dont la cellule disposent et utilisés pour la reprogrammation.
Dans le cadre de cette première modélisation, nous n'avons considéré que les boucles de régulations prédites en utilisant les données génomiques de deux espèces:
Homo sapiens et Mus musculus. Ce choix a été fait afin de limiter le nombre de faux
156
de haut taux de faux positifs. Il en va de même de la prédiction de cibles de miARN. En ne conservant que les boucles de régulation présentes dans les deux espèces, les prédictions sont enrichies en vrais positifs par rapport aux faux positifs. Par contre, cette approche ne permet pas d'identifier des boucles qui seraient spécifiques à une ou à l'autre des espèces, en particulier celles utilisant des miARN propres à l'espèce.
Cette première modélisation a été faite en utilisant les meilleures prédictions de cibles de miARN disponibles au moment d'effectuer les travaux, soit les prédictions de TargetScan. Depuis, la modélisation des interactions miARN/ARNm menant à la prédiction de cibles de miARN a été faite et a mis en évidence les limitations des méthodes précédentes. On pourrait croire que cette deuxième modélisation invalide les travaux qui ont été faits dans la première modélisation mais ce n'est pas le cas. Au contraire, les résultats de la deuxième modélisation peuvent être utilisés afin d'améliorer la première. Les prédictions obtenues alors ne seront que meilleures puisqu'utilisant des bases plus solides. Il en est de même pour l'identification des cibles des FT. De meilleures données telles que celles tout récemment obtenues par le projet ENCODE amélioreront nécessairement les résultats de la modélisation de boucles de régulation miARN/FT.