• Aucun résultat trouvé

Objectif : Déchiffrer les relations indirectes dans les réseaux

de cette thèse proposera ainsi des éléments pour motiver la sélection de l’une de ces représentations qui soit appropriée à notre problématique.

3.3 Objectif : Déchiffrer les relations indirectes

dans les réseaux

La théorie des graphes offre de nombreux outils pour l’étude des réseaux biologiques[5] dont les réseaux métaboliques. Elle a notamment été employée pour l’identification de motifs répétés au sein d’un réseau ou conservés entre des ré-seaux issus de différents organismes[222][185][161]. L’autre aspect, qui sera dé-taillé dans cette thèse, est l’utilisation de la théorie des graphes pour élucider les relations entre les métabolites, notamment au travers de la notion de proximité. Considérer uniquement les interactions directes entre les éléments du réseau re-vient à sous-estimer la propagation de certains phénomènes dans ce réseau, tels qu’un changement de concentration dans un réseau métabolique. Il convient dès lors d’étendre la notion de connectivité à celle de proximité, qui peut s’appré-cier au travers de connexions indirectes. Cette proximité permet d’extraire des sous-réseaux de tailles interprétables dont les membres partagent des liens forts (une proximité) avec un ou plusieurs métabolites d’intérêt, tels que des méta-bolites discriminants deux conditions, obtenus par analyse métabolomique. Elle permet également d’identifier des regroupements de métabolites « proches », nom-més communauté, qui peuvent s’apparenter à la notion de cluster appliquée aux réseaux. La proximité, quand elle est généralisée à l’ensemble du réseau, ouvre sur la notion d’importance d’un sommet. Un sommet « important » peut alors être caractérisé par une proximité générale à tout autre sommet du réseau, ou à un ensemble de sommets d’intérêt. De nombreuses interprétations biologiques peuvent être postulées à partir de ces notions de groupes, d’importance et plus généralement de proximité dans les réseaux métaboliques.

Les sections suivantes ont pour but de formaliser ces notions au travers de mesures issues de la théorie des graphes. Certaines de ces mesures seront détaillées

dans les parties suivantes lors de leur application aux réseaux métaboliques.

3.3.1 Distances et problème du plus court chemin

La proximité repose sur l’interprétation d’une distance entre des éléments. La représentation des réseaux sous forme de graphes offre une définition intuitive de la distance au travers de la longueur du chemin le plus court entre deux sommets[69]. Ce problème est très étudié en théorie des graphes, avec de nombreuses applica-tions telles que la recherche d’itinéraire routier ou la planification. Pour son appli-cation aux graphes « real-world » il est souvent nécessaire de prendre en compte différents paramètres afin d’obtenir une distance réaliste. Il est par exemple utile dans le cas de la recherche de chemins dans les réseaux routiers de prendre en compte la longueur des routes ou une estimation du temps nécessaire pour les traverser en voiture. Ces paramètres peuvent être formulés sous forme de poids dans un graphe attribué. Ce poids peut être vu comme un « coût de passage » pour l’emprunt d’un arc ou d’un sommet, la problématique de recherche de chemin avec un nombre « d’étapes » minimal devient alors une problématique de recherche de chemin de poids cumulé minimal. On parle parfois du chemin le plus léger (lightest path).

3.3.2 Notions de centralité et de métriques d’influence

La centralité est un indicateur permettant de classer les éléments d’un graphe (usuellement les sommets), en fonction de leur importance dans le réseau. L’im-portance est un concept relatif qui se définit par rapport à un rôle donné, ainsi la centralité peut être définie de nombreuses manières. La centralité peut par exemple estimer l’influence d’un sommet sur le reste du réseau, en mettant en exergue ceux possédant un plus grand nombre de connexions (centralité de de-grés) ou ceux dont la distance moyenne avec tout autre sommet est la plus faible (centralité de proximité, ou closeness). Ce type de centralité a été notamment appliqué aux réseaux sociaux pour identifier des personnes d’influence au sein d’un groupe, ou en épidémiologie pour identifier des vecteurs de transmission. Les

3.3 Objectif : Déchiffrer les relations indirectes dans les réseaux

indices de centralité permettent de classer les nœuds d’un réseau pour identifier les éléments « exceptionnels », en revanche elles ne permettent pas de comparer les nœuds deux à deux ni de capturer les rôles des nœuds qui ne sont pas par-ticulièrement importants[165]. Ce constat a conduit à la création de métriques d’influences. L’une des plus connues, intrinsèquement liée à la notion de proxi-mité, est celle d’accessibilité qui mesure le nombre de nœuds atteignables depuis le nœud considéré, étant donnée une distance maximale (exprimée en longueur de chemin). De manière générale, la centralité peut être vue comme une extension du concept de proximité entre deux nœuds à celui de proximité relative d’un nœud avec un ensemble d’autres nœuds, voir avec la totalité des nœuds du réseau.

3.3.3 Notion de Network flow

Les relations indirectes peuvent donc être représentées sous forme de chemins (au sens large de successions de nœuds adjacents). Il a été postulé que les quali-tés représentatives des concepts précédemment ciquali-tés, en particulier la centralité, reposent sur une définition adéquate des échanges qui conduisent à ces relations indirectes. En d’autres termes, l’importance d’un acteur dans un réseau dépend de la manière dont l’information circule dans ce réseau. Il devient donc essentiel de définir des contraintes sur les chemins qui vont servir à définir la centralité, et plus généralement la proximité. Dans ce contexte, Borgatti conceptualise la notion de

flow[37], au travers d’une série d’exemples : le premier est la livraison d’un colis,

qui va transiter d’une personne à une autre jusqu’à atteindre son destinataire. Le parcours du colis en question est soumis à un objectif précis, la réception par le destinataire, et a vocation à remplir cette tâche de manière optimale. Ainsi le colis n’a pas de raison de transiter plusieurs fois par la même personne, et aura ten-dance à circuler via un nombre d’acteurs le plus petit possible. Il est dans ce cas raisonnable de considérer des chemins élémentaires, et de surcroît géodésiques, c’est-à-dire les plus courts chemins, pour définir la centralité des acteurs du réseau. Un des autres exemples fourni par Borgatti est celui de la diffusion d’une ru-meur au sein d’un réseau social. Contrairement au colis, la ruru-meur n’a pas

d’exis-tence physique propre et peut être présente en plusieurs endroits du réseau à la fois, car elle n’est pas « perdue » par l’émetteur, lorsque partagée avec son voisin. Elle circule ainsi dans le réseau par duplication plutôt que par transmission. Sa diffusion n’est pas motivée par un destinataire à atteindre, et un acteur peut recevoir plusieurs fois la rumeur, ce qui peut rendre l’utilisation des plus courts chemins moins appropriée dans ce contexte. L’auteur note également que, hors cas de perte de mémoire, un acteur ne diffuse pas la rumeur à une personne qu’il a lui-même informée précédemment, et inversement. Ainsi, la diffusion de la rumeur ne va pas emprunter la même arête plus d’une fois, et sera par conséquent mieux modélisée par des chemins simples (trials). Borgatti définit ainsi différentes topo-logies circulatoires[37] : les processus de transmission via des chemins géodésiques, simples, élémentaires ou non (marches) et les processus de duplication, parallèles ou en série selon que la diffusion aux voisins se fait de manière simultanée ou non, et via des chemins simples, élémentaires ou des marches.