• Aucun résultat trouvé

Résultats et discussion

2.3 Quantité d’information extractible

2.4.2 Mise en évidence d’élements clefs

Identification d’éléments dont l’importance n’était pas évidente a priori En plus des éléments dont l’importance était évidente a priori, l’analyse des sommets les plus connectés a permis d’identifier comme importants PPARGC1A, MAPK1, UBC IGF1 et IGF2. Ces éléments sont particulièrement bien décrits dans la bibliographie, ce qui est une explication à leur présence dans le haut du classement en terme d’influences qui les concernent.

Les deux facteurs de croissances IGF117 et IGF218 interviennent notamment dans le métabolisme, la croissance cellulaire et la prolifération des cellules et dans de nombreuses autres voies de signalisation [343]. PPARGC1A19est un gène dont la protéine est un coactivateur de la transcription des gènes du métabo-lisme énergétique. Cette protéine permet l’interaction de PPARγ(un régulateur du stockage des acides gras et du métabolisme du glucose) avec divers facteurs de transcription. Elle intervient aussi dans la régulation de la genèse des mitochondries et elle possède divers autres rôles non détaillés ici20.

MAPK121 a aussi été identifiée comme un élément fortement régulé (en raison du nombre élevé d’in-fluences entrantes). La protéine codée par ce gène est impliquée dans de nombeux mécanismes de régulation. Elle joue notamment un rôle dans la régulation de la synthèse des acides gras [238]. Cette protéine fait partie de la famille des MAP kinases. Les MAP kinases interviennent dans la prolifération et la differentiation des cellules (voir notamment MAPK14 ou p38MAPK, et les protéines ERK [243, 323]) , dans la régulation de la transcription et dans le contrôle du développement [281, 44]. Cette protéine est un élément d’un immense carrefour de nombreuses voies de signalisation dont le rôle est bien plus vaste que celui du métabolisme énergétique.

L’UBC22 est une protéine capable de se fixer à d’autres protéines pour adresser ces dernières vers la dégradation dans le proteasome. Cette protéine joue aussi un rôle dans la maintenance de la structure chromatique, dans la régulation de l’expression des gènes, dans la réponse au stress, dans la genèse des ribosome, dans la réparation de l’ADN23et dans le métabolisme de l’énergie [338].

Ces quatre molécules sont décrites dans la bibliographie pour avoir un rôle dans le métabolisme éner-gétique ou le métabolisme des lipides, ce qui est cohérent avec leur présence dans la liste. Elles participent aussi à la régulation de nombreuses autres fonctions biologiques. Cette analyse a donc fait ressortir leur importance en tant que carrefour de diverses voies de signalisation. Ces molécules sont de bons candidats potentiels24 en terme de régulateurs clefs du métabolisme en réponse au jeûne.

15La protéine codée par ce gène est impliquée dans de nombeux mécanismes de régulations. Elle joue notamment un rôle dans l’apoptose.

16Le nom HGNC officiel pour la fatty acid synthase n’est pas FAS mais FASN. 17Insulin-like growth factor 1 (somatomedin C)

18Insulin-like growth factor 2 (somatomedin A) 19PPARγ, coactivator 1 alpha

20D’aprèswww.ncbi.nlm.nih.gov. 21Mitogen-activated protein kinase 1 22Ubiquitin C

23D’aprèswww.genecards.org

Un métabolisme très connecté aux autres fonctions D’un côté PPARGC1A et MAPK1 sont di-rectement reliées par au moins une influence à un élément de la liste des 1 738 gènes et d’un autre côté ces molécules sont décrites comme intervenant dans la régulation de nombreuses fonctions biologiques. Il existe donc des liens directs (en terme d’influences) entre le métabolisme énergétique et d’autres fonctions de la cellule. Parmi ces fonctions, certaines influent directement sur la consommation d’énergie (comme par exemple la prolifération cellulaire). La présence de ces liens illustre la complexité de ce métabolisme et rend difficile la construction d’une frontière pour l’étudier comme une entité isolée.

Tab.2.4.1 – Liste des 10 sommets les plus connectés au reste du graphe

Nombre d’influences totalesa Nombre d’influences entrantesb Nombre d’influences sortantesc Identifiant nombre Identifiant nombre Identifiant nombre

[HGN C]-IGF1 922 [HGN C]-FASN 357 [HGN C]-IGF1 707

[HGN C]-FASN 605 [HGN C]-IRS1 352 [HGN C]-INS 529

[HGN C]-IRS1 601 [HGN C]-IGF1 215 [HGN C]-IRS1 249

[HGN C]-INS 561 [HGN C]-IRS2 171 [HGN C]-FASN 248

[HGN C]-FASd 266 [HGN C]-ACACA 131 [HGN C]-FAS 208

[HGN C]-IRS2 259 [HGN C]-ABCA1 120 [HGN C]-UBC 172

[HGN C]-PPARGC1A 247 [HGN C]-HMGCR 108 [HGN C]-PPARGC1A 148

[HGN C]-IGF2 231 [HGN C]-FABP4 101 [HGN C]-NR1H3 147

[HGN C]-NR1H3 204 [HGN C]-PPARGC1A 99 [HGN C]-IGF2 139

[HGN C]-ABCA1 184 [HGN C]-MAPK1 98 [HGN C]-ACOX1 114

[HGN C]-UBC 184

aReprésente le nombre d’influences dans lesquelles le sommet est soit la source soit la cible

bReprésente le nombre d’influences dans lesquelles le sommet est la cible

cReprésente le nombre d’influences dans lesquelles le sommet est la source

dFAS est(TNF receptor superfamily, member 6), ce n’est pas la fatty acid synthase qui est notée FASN.

2.5 Conclusion

L’extraction d’influences à partir des bases de données bibliographiques est possible En se limitant aux éléments relatifs au métabolisme énergétique25 et aux sommets annotés par un terme HGNC ou KEGG (bases [SR]), on obtient un graphe de 9 667 interactions et 3 865 sommets. En ne se limitant pas aux éléments annotés dans KEGG ou HGNC (bases [R]), le graphe construit contient 12 391 interactions et 5 903 sommets.

Tous les éléments d’intérêt ne sont pas décrits TRANSPATH [R] contient 47% des gènes de la liste des 1 738 identifiés comme importants dans le métabolisme énergétique, Ingenuity [R] 14% et Gardon [R] 4%. Une fois ces trois bases réunies, le graphe d’influences construit contient 49% des gènes de la liste.

Au final, malgré une quantité d’informations importante, seulement la moitié des gènes d’intérêts est impliquée dans au moins une influence. De plus, l’exploitation d’Ingenuity et de Gardon augmente la couver-ture seulement de 2% par rapport à l’utilisation de TRANSPATH. En effet, les bases de données contiennent une forte proportion de sommets communs (c.f. tableau 2.3.3), et cet ensemble ne suffit pas à traiter tous les éléments de notre liste d’intérêt.

Cette structure reflète probablement la structure de la bibliographie : les bases traitent un ensemble commun de sommets bien décrits dans les publications (i.e. les sommets de la liste présents dans les bases et les sommets des influences récupérées) tandis que les sommets peu décrits ne sont présents dans aucune des bases.

Les influences des bases sont complémentaires Bien que les bases analysées aient de nombreux sommets communs, elles contiennent des influences différentes. Il est donc utile d’exploiter l’ensemble de ces bases afin d’avoir une meilleure couverture des influences relatives au métabolisme énergétique.

Les bases généralistes ne couvrent pas la base experte L’ensemble des influences extraites des deux bases généralistes TRANSPATH et Ingenuity ne recouvre pas les influences extraites de Gardon. Par conséquent sur un sujet tel que le métabolisme des lipides (le coeur de cible de Gardon), les bases généralistes ont d’importantes lacunes et ne peuvent pas se substituer entièrement à la réalisation d’un base experte. L’extraction d’influences à partir de TRANSPATH est plus aisée qu’à partir d’Ingenuity Parmi les bases analysées, TRANSPATH est la meilleure source pour l’extraction influences, que ce soit de manière générale ou relativement au métabolisme énergétique. En effet, en plus d’un contenu important, TRANSPATH met à disposition une structure de données facilement exploitable. Cette dernière contient des relations dont le sens est clairement défini dans la documentation et des molécules identifiées par une référence vers des bases classiques de molécules.

Identification d’éléments clefs Au final, la construction de graphe d’influences permet de mettre en évidence des élémens clefs en relation avec un ensemble de gènes. La plupart de ces éléments sont cohérents avec les résultats duclustering et correspondent aux éléments connus par l’expertise et couramment décrits dans la bibliographie, ce qui corrobore cette méthode.

Cette méthode identifie aussi des éléments dont le rôle dans le métabolisme énergétique est connu, mais dont l’importance n’est pas évidente. La construction de graphes d’influences est donc utile pour repérer les principaux carrefours de transduction du signal auxquels sont connectés les éléments d’une liste.

La simple analyse des sommets les plus connectés est néanmoins une méthodologie brutale. Elle est fortement biaisée par l’abondance de bibliographie sur certains éléments : elle peut mettre en évidence un sommet clef très décrit dans un contexte différent du métabolisme énergétique et qui posséde une seule intéraction en lien avec les 1 738 de la liste. Par conséquent elle n’exploite pas toute la structure du réseau et de meilleurs résultats restent envisageables suite au développement de méthodes d’analyses plus fines de ce graphe, par exemple en exploitant sa topologie de manière plus globale et/ou en intégrant dans l’analyse la variation de certains sommets mesurée expérimentalement.

Troisième partie

Analyse d’un système complexe par