• Aucun résultat trouvé

Chapitre 1 : Synthèse bibliographique & Objectifs de thèse

3. Des approches innovantes pour l’étude de la relation de cause à effet

3.1. L’entrée des –omiques en écotoxicologie

3.2.2. Etapes de l’approche métabolomique non ciblée

3.2.2.8. Visualisation & Interprétation des données métabolomiques

Le contexte biologique d’un métabolite se situe au sein d’un ensemble de réactions chimiques, catalysées par des enzymes, ayant pour objectif de synthétiser (i.e. anabolisme) ou dégrader (i.e. catabolisme) un métabolite, en passant par plusieurs métabolites intermédiaires servant eux-mêmes de substrat pour les réactions suivantes, cela s’appelle une voie métabolique. La régulation d’une voie métabolique s’inscrit dans le maintien de l’homéostasie cellulaire, et dans un besoin fonctionnel du système biologique étudié. En effet, certaines voies métaboliques, ou groupe de métabolites, sont connues pour être impliquées dans certaines fonctions biologiques, comme par exemple les catécholamines (ex. dopamine, norépinephrine ; voie métabolique de la tyrosine) reconnues pour avoir un rôle dans les fonctions reproductives des mollusques bivalves (Fong et al., 1993; Lafont and Mathieu, 2007). Ainsi, replacer les métabolites d’intérêt dans leur contexte biochimique permettrait d’orienter la ou les fonctions biologiques susceptibles d’être perturbées par ces modifications métaboliques. La communauté scientifique a donc porté un grand intérêt à l’analyse

75 des voies métaboliques donnant naissance à plusieurs outils dédiés, tels que le propose la plateforme en ligne MetaboAnalyst 4.0 (Chong et al., 2019). Parmi de nombreux outils destinés au traitement et à l’analyse des données métabolomiques, MetaboAnalyst met à disposition l’outil MetPA (Metabolomics Pathway Analysis) pour l’analyse des voies métaboliques (Xia and Wishart, 2010). A partir d’une liste de métabolites d’intérêt, MetPA permet d’identifier les voies métaboliques les plus pertinentes impliquées dans une étude métabolomique donnée, et ce à l’aide d’une analyse de surreprésentation (over-representation analysis) ou bien d’une analyse d’enrichissement des voies (pathway enrichment analysis) qui peut être combinée à une analyse des caractéristiques topologiques des voies (pathway topological analysis). L’analyse de surreprésentation consiste à vérifier à partir de la liste des métabolites d’intérêt si le nombre de métabolite associé à une voie métabolique est dû au hasard ou non. Pour cette analyse, deux méthodes sont au choix : le test exact de Fisher ou le test hypergéométrique. Toutefois cette analyse considère seulement le nombre de métabolites par voie métabolique et n’intègre pas l’amplitude du changement de leur abondance entre deux conditions testées. Ainsi les métabolites dont l’amplitude est plus significative auront le même poids que des métabolites moins significatifs. Quand les concentrations des métabolites sont disponibles, il est donc préférable de se baser sur l’analyse d’enrichissement des voies. Cependant, utilisée seule, ni l’analyse de surreprésentation ni l’analyse d’enrichissement des voies ne prennent en compte la structure de la voie métabolique afin de déterminer quelles voies seraient les plus impliquées selon les conditions d’étude. En effet, une voie métabolique pouvant être considérée comme un réseau métabolique avec des métabolites (i.e. les nœuds) connectés les uns aux autres, combiner les analyses précédentes avec une analyse topologique des voies permet d’intègrer cette structure et donne davantage de poids à des métabolites centraux de ce réseau qu’à des métabolites plus marginaux. L’analyse topologique des voies propose deux mesures de la centralité d’un métabolite pour estimer son importance : la centralité intermédiaire (betweenness centrality, i.e. localisation d’un métabolite par rapport à la structure globale du réseau) ou le degré de centralité (degree centrality, i.e. connectivité locale directe entre un métabolite et ses voisins) (Figure 1.19).

76

Figure 1.19 : Réseau métabolique représenté par des nœuds (i.e. métabolites) reliés par des traits (i.e. connexion entre les métabolites). En rouge sont représentés les métabolites ayant un fort degré de centralité et en bleu le métabolite ayant une forte centralité intermédiaire.

L’analyse des voies métaboliques génère finalement différents graphiques représentés en Figure 1.20. La visualisation globale de l’analyse (Figure 1.20A) offre une hiérarchisation des voies métaboliques en fonction de leur significativité (axe des ordonnées ; la valeur de p est donnée par l’analyse de surreprésentation ou d’enrichissement des voies) et de leur impact (axe des abscisses ; calculé selon l’importance des métabolites mesurée lors de l’analyse topologique des voies). Ce graphique étant interactif, il est ensuite possible de découvrir la voie métabolique associée à chaque cercle, représentée en Figure 1.20B avec en couleur les différents métabolites présents dans la liste d’intérêt qui ont été associés à cette voie. Si des données quantitatives ont été jointes à l’analyse, il est également possible de visualiser les différences d’abondances entre deux conditions testées pour un métabolite sélectionné (Figure 1.20C). L’analyse des voies métaboliques semble être une bonne approche pour replacer les métabolites dans leur contexte biologique et ainsi déterminer qu’elles peuvent être les voies métaboliques les plus impactées vis-à-vis d’un stress donné.

77

Figure 1.20 : Illustration des résultats issus de l’outil MetPA pour l’analyse des voies métaboliques. (A) Visualisation de l’analyse globale, (B) visualisation des voies métaboliques, (C) visualisation des métabolites (Xia and Wishart, 2010).

Cependant, le concept de voie métabolique présente actuellement trois limites majeures (Barupal et al., 2018). Premièrement, les bases de données renseignant sur les voies métaboliques sont incomplètes et se limitent à un nombre réduit d’espèces. Généralement, la moitié des métabolites détectés lors d’une analyse métabolomique ne possède pas de voie métabolique associée dans les bases de données existantes. Deuxièmement, les voies métaboliques sont définies manuellement et de cette manière varient à travers les différentes bases de données. En effet, certains outils d’interprétation utilisent par exemple des voies métaboliques référencées dans KEGG et incluent le chevauchement et le croisement de celles-ci, mais ne tiennent pas compte de la compartimentation cellulaire. D’autres bases de données telles que MetaCyc définissent quant à elles des voies métaboliques comme des séquences linéaires inintérompues de réactions enzymatiques. Troisièmement, de nombreux métabolites sont souvent membres de plusieurs voies métaboliques, menant à des difficultés dans l’interprétation des données et également des biais dans les analyses statistiques d’enrichissement de voies métaboliques. Une alternative aux voies métaboliques pourrait être l’organistion des métabolites en classe chimique selon leur similarité structurale (i.e. Chemical Ontology) (Barupal et al., 2018; Moreno et al., 2015; Tsuyuzaki et al., 2015). La relation entre la similarité chimique des métabolites suppose que peu d’enzymes contrôlent ou interconvertissent ces composés, même si la nature exacte de ces enzymes n’est pas connue. Ainsi, la structuration des métabolites sous forme de classes chimiques présente deux avantages majeurs par rapport à la définition des voies métaboliques et des statistiques d’enrichissement des voies (Barupal et al., 2018). Premièrement, presque tous les métabolites peuvent être annotés dans une classe chimique même si

78 un métabolite n’est pas associé à une réaction enzymatique et donc à une voie métabolique. Deuxièment, les classes peuvent être définies de telle sorte que chaque métabolite n'appartienne qu'à une seule classe, évitant de cette manière les chevauchements et les biais lors de l’analyse d’enrichissement. Récemment, des progrès ont été réalisés en combinant les ontologies des classes chimiques et la cartographie des similarités chimiques afin d’associer chaque métabolite à une classe chimique et ainsi révéler les classes de métabolites les plus impactées sous l’effet du stress étudié. Cette approche a été publiée sous le nom de ChemRICH (Chemical Similarity Enrichment Analysis ; Barupal and Fiehn, 2017).

Enfin, pour aider à l’interprétation biologique, les bases de données biochimiques (ex. KEGG, HMDB, etc.) fournissent un large éventail d’informations sur les métabolites qui inclut les réactions, les enzymes et les gènes impliqués, les sources pour les métabolites exogènes, leur propriété de signalisation, leur(s) voie(s) métabolique(s), leur classe chimique ainsi que leurs rôles biologiques connus. La littérature regorge également d’informations pertinentes sur les métabolites et est parfois plus adaptée lorsque l’organisme d’étude est une espèce non-modèle très peu référencée dans les bases de données. Le recours à des outils de text mining (i.e. exploration de textes) peut parfois être efficace pour extraire les informations recherchées dans la littérature et faire le lien entre des métabolites et des connaissances biologiques. Par exemple, un des outils de text mining existant dans le domaine médical est PolySearch2 (Liu et al., 2015) qui, en se basant sur différentes ressources scientifiques (ex. MEDLINE, PubMed, etc.) permet d’identifier les relations entre plusieurs entités biomédicales (ex. maladies, gènes, protéines, métabolites, voies métaboliques, organes, mode d’action d’un composé, etc.) et un terme associé (ex. Bisphénol A). Toutefois, ces outils, parfois trop spécifiques à un domaine, sont encore à développer et pourront à l’avenir apporter une aide précieuse dans l’interprétation des résultats métabolomiques (Barupal et al., 2018).

3.2.3. Application de l’approche métabolomique à la problématique des produits