G´en´eration d’enveloppes ` a partir de l’espace topologique

7.2 Utilisation d’enveloppes concaves

7.2.2 G´en´eration d’enveloppes ` a partir de l’espace topologique

Même si la précédente technique permet de calculer des enveloppes très esthétiques, semblables à des enveloppes dessinées à main levée, elle ne passe pas très bien à l’échelle pour visualiser efficacement un grand nombre de groupes chevauchants. En effet, elle ne permet pas de moduler précisément la largeur d’une enveloppe et par conséquent il peut être difficile de distinguer les frontières de chaque ensemble. Pour pallier à ce problème, nous avons investigué une autre méthode qui calcule des enveloppes concaves à partir

Figure 7.3: Exemple d’application de notre méthode de génération d’enveloppes concaves depuis l’espace image pour mettre en évidence des sous-graphes. Une vue détaillée du réseau métabolique du réseau métabolique de l’organisme Saccharomyces cerevisiae (levure) est présentée. Les voies métaboliques contenant l’élément ”PAPS” ont été mises en évidence avec notre méthode.

de l’espace topologique du graphe à visualiser. Par espace topologique nous entendons l’espace continu de coordonnées dans lequel la représentation du graphe est plongée.

Détail de la technique La Figure7.4 illustre les différentes étapes de notre méthode. Sur l’image la plus à gauche, on peut voir un dessin de réseau de co-occurrence des person-nages du livre Les Misérables [117] écrit par Victor Hugo. Un ensemble de sous-graphes d’intérêt a été calculé sur ce réseau en utilisant l’algorithme Link Communities [3].

Dans un premier temps, un graphe de dépendance (voir Définition 2.29) est calculé afin de modéliser la fa¸con dont les différents ensembles (sous-graphes) à visualiser se che-vauchent. Ensuite un algorithme de coloration propre de graphe est appliqué sur ce graphe de dépendance pour assigner à chaque ensemble une valeur positive de telle sorte que deux ensembles se chevauchant aient des valeurs différentes. Cette valeur sera ensuite utilisée pour déterminer la distance dans le plan entre un sous-graphe et l’enveloppe l’entourant. Appliquer cette coloration sur le graphe de dépendance nous permet de garantir que les

Figure 7.4: Illustration du pipeline de la méthode : à partir d’une décomposition de graphe chevauchante, un ensemble d’enveloppes distinguables les unes des autres est calculé.

enveloppes des différents ensembles chevauchants seront toutes distinguables en leur affec-tant une largeur proportionnelle à leur valeur de coloration et en les rendant dans l’ordre décroissant de ces valeurs.

N’importe quel algorithme de coloration propre pourrait être utilisé pour cette tâche. Cependant pour faciliter la visualisation d’ensembles imbriqués, nous avons besoin d’un algorithme de coloration dédié. Par exemple si l’on considère deux ensembles imbriqués, pour identifier facilement que l’un est contenu dans l’autre, son enveloppe doit être conte-nue dans l’enveloppe de l’autre ensemble (voir Figure7.5).

(a) (b)

Figure 7.5: Illustration de la visualisation d’ensembles imbriqués. (a) La valeur de coloration assignée à l’ensemble contenu dans l’autre est plus grande que celle de l’autre ensemble. L’enveloppe de l’ensemble contenu dans l’autre est alors plus large que celle de l’autre ensemble, compliquant son identification. (b) Quand l’ensemble contenu dans l’autre a une valeur de coloration plus faible que celle de l’autre ensemble, l’imbrication des enveloppes permet de voir clairement la relation d’inclusion entre les deux.

Notre procédure de coloration va ainsi créer un ordre sur les différents ensembles de telle sorte que cet ordre reflète la complexité de chaque ensemble. Dans notre cas, nous utilisons le nombre de sommets pour évaluer la complexité d’un ensemble. Le détail de cette

procédure est le suivant. `A partir d’un graphe de dépendance G = (V, E) et d’une fonction de valuation de sommets P (ici P (u) est le nombre de sommets de l’ensemble associé au sommet u dans le graphe de dépendance), notre algorithme fournit une coloration C telle que ∀(u, v) ∈ E, si P (u) < P (v) alors C(u) < C(v). L’algorithme est basé sur un parcours de graphe en largeur, noté BFS pour Breadth-first search, et a donc une complexité en temps linéaire. Son détail est présenté à l’Algorithme 2

Algorithme 2 Algorithme de coloration dédiée appliqué sur le graphe de dépendance modélisant les chevauchements entre les sous-graphes à visualiser.

1: Phase d’initialisation : ∀u ∈ V, C(u) = P (u).

2: Faire un BFS `a partir d’un sommet non visit´e u. Lors du parcours, on ins`ere dans la file des prochains sommets `a visiter seulement les sommets v tels que P(v) = P (u). Au cours de cette phase, on calcule et conserve les valeurs suivantes :

– σ(u) correspondant `a la composante connexe (maximale sous inclusion) form´ee par u et tous les sommets v ∈ V ayant P(u) comme valuation.

– maxL (resp. minG) qui est la valeur maximum de C plus petite que C(u) (resp. la valeur minimum de C plus grande que C(u)) dans le voisinage direct de σ(u).

3: Assigner `a tous les sommets de σ(u) diff´erentes valeurs dans l’intervalle ]maxL, minG[ si minG 6= maxL, sinon dans l’intervalle [1, |σ(u)|].

4: Marquer tous les sommets v ∈ σ(u) comme visit´es.

5: Répéter l’étape 2 jusqu’à ce que tous les sommets aient été visités.

Une fois cette étape effectuée, nous pouvons alors calculer les enveloppes associées à chaque sous-graphe. Comme nous avons besoin de pouvoir moduler précisément leurs lar-geurs, notre solution pour les générer est basée sur du clipping de polygones et fonctionne dans l’espace topologique. L’idée est de calculer l’union de polygones construits à partir de la position des sommets et des arêtes du sous-graphe à mettre en exergue. Le polygone associé à un sommet peut être par exemple un cercle dont le centre est la position du som-met et le rayon est défini par la boite englobante du somsom-met ainsi que la largeur désirée de l’enveloppe. Le polygone associé à une arête consiste en l’extrusion de la ligne brisée la représentant paramétrée par la largeur désirée de l’enveloppe. Pour calculer l’union de tous ces polygones, nous utilisons la bibliothèque Clipper [108] : une implémentation efficace de l’algorithme de clipping de polygones mis au point par Vatti [185]. Des illustrations de ce processus de génération d’enveloppe sont présentées à la Figure7.6.

Comparaison avec l’autre méthode de génération d’enveloppes La Figure 7.7

présente une comparaison des résultats obtenus en appliquant les deux méthodes de géné-ration d’enveloppes concaves pour visualiser le résultat d’une décomposition chevauchante

(a) (b) (c) (d)

Figure 7.6: Illustration du processus générant une enveloppe concave pour entourer le dessin d’un sous-graphe. (a) Sous-graphe à mettre en exergue. (b) L’ensemble de polygones dont l’union doit être calculée. Les cercles rouges sont les polygones calcu-lés à partir de la position des sommets, les quadrilatères bleus sont ceux calculés à partir de la position des arêtes. (c) Illustration d’une étape intermédiaire du proces-sus d’union des polygones. Le polygone vert correspond à l’union déjà calculée. Les polygones bleus sont ceux restants à traiter. (d) Enveloppe concave résultante.

sur un graphe d’exemple. Dans la Figure 7.7(a), les enveloppes ont été calculées en uti-lisant la méthode travaillant dans l’espace image de la visualisation (voir section 7.2.1). Dans la Figure 7.7(b), les enveloppes ont été générées avec la méthode travaillant dans l’espace topologique introduite dans la section courante. On observe qu’avec la première méthode, il est difficile d’identifier précisément chaque sous-graphe de la décomposition. Le problème vient du fait que certaines frontières d’enveloppes sont parfois confondues. Ce problème n’apparaˆıt pas avec la seconde méthode car la largeur de chaque enveloppe a pu être modulée précisément afin qu’elles soient toutes clairement distinguables les unes des autres.

Exemples d’application Nous présentons ici deux exemples d’application de cette mé-thode de génération d’enveloppes concaves pour la visualisation d’une décomposition che-vauchante de graphe.

Le premier exemple consiste en la visualisation d’une décomposition chevauchante du réseau de co-occurence Les Misérables [117]. Les sommets de ce graphe représente l’ensemble des personnages de l’œuvre de Victor Hugo. Une arête relie deux personnages si ils apparaissent dans le même chapitre du livre. La décomposition a été calculée à l’aide de l’algorithmeLink Communities [3]. Cet algorithme ne produit pas uniquement des sous-graphes hautement connectés comme le font beaucoup d’algorithmes de fragmentation de graphe. Ces sous-graphes peuvent être classés en trois catégories :

(a) (b)

Figure 7.7: Comparaison entre les deux techniques de g´en´eration d’enveloppes

concaves pour la visualisation d’une décomposition de graphe chevauchante : (a) enveloppes générées depuis l’espace image, (b) enveloppes générées depuis l’espace topologique. On observe que dans (a), il est difficile d’identifier précisément chaque sous-graphe, les frontières de certaines enveloppes étant parfois confondues. Ce pro-blème n’apparaˆıt pas dans (b) car la largeur de chaque enveloppe a pu être précisément modulée afin qu’elles soient toutes clairement distinguables.

nombre de connexions entre eux.

• Sous-graphe biparti : sous-ensemble de sommets reliant des sous-graphes haute-ment connect´es.

• Sous-graphe arborescent : sous-ensemble de sommets formant un arbre, pouvant ´egalement relier des sous-graphes hautement connect´es.

Avec notre méthode, nous pouvons visualiser cette classification en assignant à chaque enveloppe une couleur associée à la catégorie du sous-graphe qu’elle entoure. Le résultat est présenté à la Figure7.8. A l’échelle globale de la visualisation (voir Figure7.8(a)), on peut observer de petits sous-graphes qui s’intersecte avec de plus grands. Les différents sous-graphes hautement connectés (en bleu) ou les sous-graphes arborescents (en vert) sont clairement identifiables. On peut voir par exemple que chaque sommet appartient au plus à un sous-graphe hautement connecté. Le centre du dessin dans la Figure7.8(a)

est plus complexe à visualiser. Il contient plusieurs sommets de fort degré appartenant à des sous-graphes bipartis (en rouge). Une vue détaillée de cette zonz est présentée à la Figure 7.8(b). Rappelons que les sous-graphes partageant des sommets sont représentés avec des enveloppes de largeur différente. Les différentes catégories de sous-graphes auquel appartient un sommet sont donc clairement identifiables. Par exemple on peut observer que

les sommets ”Valjean” et ”Javert” appartiennent chacun à quatre sous-graphes bipartis : ils jouent donc un important rôle de médiateur dans le réseau. On peut également voir que ”MmeThenardier” est contenu dans les mêmes groupes que ”Thenardier”, son mari dans le livre.

Le second exemple, présenté à la Figure 7.9, montre le réseau métabolique de l’orga-nisme Saccharomyces cerevisiae (levure) dessiné avec notre méthode [124] détaillée dans la section 4.3. L’ensemble des voies métaboliques de ce réseau ont été mis en exergue avec notre méthode. Ce réseau contenait à la base 836 sommets et 936 arêtes répartis sur 164 voies métaboliques. Les éléments appartenant à plus de trois voies métaboliques ont été dupliqués, résultant en un réseau de 1360 sommets et 1340 arêtes. L’intérêt de notre méthode de visualisation de sous-graphes sur ce réseau est qu’un grand nombre de métabolites/réactions ainsi que les arêtes les connectant sont partagés par plusieurs voies. On peut observer dans la vue détaillée de la Figure 7.9que chaque voie et leurs éléments communs peuvent être clairement identifiés.

Dans le document Visualisation interactive de graphes : élaboration et optimisation d'algorithmes à coûts computationnels élevés (Page 171-177)