• Aucun résultat trouvé

Dépendance par rapport à la qualité des données

données

Comme mentionné précédemment, les données de métabolomique sont carac- térisées par leur incomplétude par rapport au métabolome réel[11].

L’une des principales causes de cette incomplétude est l’absence de spectres standards pour réaliser une identification appropriée des composés. Les composés issus des banques de spectres publiques HMDB[270], MassBank[121], ReSpect[232] et GNPS[264] ont été extraits et mappés sur plusieurs réseaux métaboliques d’or-

ganismes modèles (Figure 6.1). Cette étude révèle qu’une forte proportion de mé- tabolites dans les réseaux ne peuvent être identifiés de façon certaine à partir des banques de spectres publiques, et seront dès lors omis lors de l’interprétation. Elle montre également que ces réseaux présentent un nombre important de métabo- lites sans identifiant standard, nuisant à la recherche de correspondance entre les données de métaboliques et les entrées des réseaux. Cette autre limitation sera discutée plus en détails dans la partie iii.

Figure 6.1 – Proportion de métabolites dans les réseaux métaboliques qui possèdent un spectre standard pour l’identification dans les bases de données HMDB, MassBank, ReSpect et GNPS

Les méthodes visant la simulation de processus dans les réseaux métaboliques sont très sensibles à la qualité des données d’entrées, ce qui limite leur utilisation à grande échelle à partir de données de métabolomique. Les approches topologiques visant à quantifier la proximité qui existe entre métabolites d’intérêt, est en re-

vanche moins sensible. En effet, l’ajout ou le retrait a posteriori d’un métabolite d’une liste d’intérêt n’affecte pas les distances précédemment calculées entre les autres membres de cette liste. En revanche elles sont également particulièrement tributaires de la qualité du réseau. Certaines petites variations peuvent avoir un impact sur la composition des chemins, sans particulièrement affecter de manière extrême leurs longueurs. A contrario, le retrait de certains métabolites ou cer- taines réactions peut affecter de manière drastique les distances dans le réseau, voir déconnecter certains de ses éléments. Des mesures topologiques telles que les centralités, qui seront détaillées dans le prochain chapitre, permettent d’identifier ces points critiques. L’absence de tels acteurs dans un chemin, où un faible diffé- rentiel de longueurs entre les k-shortest paths, pourrait être utilisés comme gages de stabilité de la distance entre deux métabolites face aux suppressions dans le réseau.

L’une des limites des méthodes de recherche de chemins est qu’elles ne consi- dèrent qu’une partie du réseau bornée par les métabolites d’intérêt, c’est-à-dire qu’elles vont proposer des métabolites intermédiaires et des cascades réactionnelles permettant de joindre deux métabolites d’intérêt, et ne vont pas considérer les mé- tabolites précurseurs de ces derniers. Les interprétations dérivées des sous-réseaux issus de la compilation des chemins obtenus supposent donc que l’ensemble des métabolites qui « bornent » les processus en lien avec la perturbation sont connus. Cette hypothèse n’est vraisemblablement pas vérifiée dans la plupart des cas étant donnée la nature des données, et tout particulièrement dans le cas des études sur des échantillons de biofluides où seule la fraction circulante du métabolome est considérée.

La section suivante va proposer une méthode qui tentera de répondre à cette limite, en intégrant les pistes mentionnées dans cette partie pour la prise en compte de chemins pertinents dans les réseaux métaboliques, notamment la gestion des composés auxiliaires.

Interpréter des résultats de

Systèmes de recommandation et

centralité dans les réseaux

7.1

Introduction

“A large shift is going on in our connected society : we are leaving the Information Age and entering the Recommendation Age. Today information is ridiculously easy to get ; you

practically trip over it on the street. Information gathering is no longer the issue -making smart decisions based on the

information is now the trick. . . So recommendations act as shortcuts through the information mass, getting us to the right, or « right enough » answer.”

Adam Richardson

Comme décrit en introduction, la métabolomique offre une vue partielle du métabolome. Par conséquent, statuer sur les mécanismes affectés par une condi- tion s’avère ardu étant donné les pièces manquantes du puzzle. Dans l’optique de proposer des métabolites potentiellement affectés par la perturbation, mais absents de la liste de molécules discriminantes, la centralité apparaît comme un outil approprié. En effet, en mettant en exergue les métabolites partageant une plus grande proximité avec les métabolites discriminants, de nouvelles hypothèses

peuvent émerger.

Ce type d’approches s’apparente à la famille des systèmes de recommandation. Les systèmes de recommandation ont pour vocation de suggérer à un utilisateur des éléments (items) pertinents, étant donné par exemple les éléments pour lesquels l’utilisateur a déjà manifesté un intérêt. Ces systèmes ont acquis une grande po- pularité ces dernières années, notamment dans le domaine des activités en lignes. Ils ont été utilisés pour suggérer de nouveaux articles sur les sites de vente en ligne, des films[29], des vidéos ou des musiques sur les plateformes de visionnage ou d’écoute à la demande[17] ou encore des personnes à suivre sur les réseaux sociaux numériques[107][169]. Les systèmes de recommandation répondent à un nouveau besoin, dans un monde où l’accès à l’information est devenu aisée, mais où le défi repose dans la manière de traiter intelligemment cette masse d’informa- tion. Les systèmes de recommandation permettent de « dégrossir » cette masse de données pour obtenir une information la plus pertinente et la plus raffinée possible. Ces développements récents offrent également une opportunité pour l’analyse de données de métabolomique étant donné l’analogie entre les problématiques qu’ils résolvent et les besoins en métabolomique. La métabolomique met en évidence un ensemble de métabolites d’intérêt, en lien avec une condition biologique donnée. Cet ensemble étant incomplet[11], un système de recommandation proposant des métabolites d’intérêt potentiel, étant donné un ensemble initial, semble constituer une opportunité intéressante pour tirer parti au maximum des résultats obtenus en métabolomique. De plus, les réseaux métaboliques fournissent une structure de données qui a été largement exploitée pour les systèmes de recommandation.