• Aucun résultat trouvé

7.5 Positionnement des itemsets

7.5.1 Définition de la distance

La vue globale de la structure du graphe est donnée par la position des nœuds et des segments qui les relient. Améliorer sa lisibilité revient à faire ressortir les nœuds qui sont reliés entre eux.

Un nœud étant un itemset, il représente une information issue d’un attribut ou d’une classe d’attributs. Rapprocher des nœuds signifie donc regrouper des informations. Pour cela, nous gardons la position discrète des nœuds et le maintien de la distance minimale entre deux nœuds. Si ces informations sont liées, alors le rapprochement des nœuds correspond à un partage d’information. Cette notion de lien entre les informations correspond à des liens entre les itemsets. Le lien est établi, par exemple, si un itemset est superset ou sous-set d’un autre, si deux itemsets contribuent à construire un superset commun ou sont supersets commun d’un même sous-set. Il est donc intéressant de regrouper les nœuds qui sont liés et de les éloigner s’ils ne le sont pas. Cela va ainsi créer des clusters d’itemsets, et donc d’information. Considérant que les clusters sont sur des cercles, il existe deux manières de calculer la distance

entre eux, dans le sens des aiguilles d’une montre ou dans le sens inverse. De plus, comme les itemsets sont liés entre deux cercles consécutifs, la distance entre les clusters de différents cercles doit être également considérée.

C’est pourquoi, l’optimisation globale du graphe, qui est obtenu en optimisant la position des itemsets, et donc des clusters, est le résultat de la combinaison de l’optimisation de la position des itemsets entre eux sur chaque cercle, et de l’optimisation de la position relative des clusters disposés sur les cercles. Nous considérons donc une distance appelée d que nous allons minimiser. Elle est la somme de la distance intra-cercle icd et de la distance inter-cercle

ecd, que nous allons définir ci-dessous.

Distance intra-cercles

La distance intra-cercle icd est obtenue par l’algorithme LinLog [Noack 03], qui est un modèle d’énergie. Bien qu’il ait été conçu pour regrouper des nœuds de graphes généraux en clusters, nous l’appliquons avec la contrainte du positionnement des nœuds sur des cercles concentriques.

Définition 16 (d(u, v)) La distance entre deux nœuds d’un même cercle est définie de la

manière suivante :

• Nous appelons Vi l’ensemble des nœuds sur le cercle Ci. V est l’union des ensembles de nœuds Vi : V = N [ i=1 Vi

• E est l’ensemble des segments reliant les nœuds de cercles consécutifs, défini par :

E =

N −1

[

i=1

Ei

Où Ei= {(ui, wi+1) ∈ Vi× Vi+1, (ui, wi+1) ∈ E}.

• La distance entre deux nœuds u et v d’un même cercle est définie par :

d(u, v) = kpv− puk

A partir de cette distance, il est possible de calculer l’énergie LinLog ULinLog(p) [Noack 03]

d’un graphe p, définie par l’équation suivante :

ULinLog(p) = X {(u,w),(v,w)}∈E2 i kpu− pvk − X {u,v}∈V2 i lnkpu− pvk (7.1)

Le premier terme correspond à l’attraction entre les nœuds adjacents, et le second à la répulsion entre les nœuds.

Chapitre 7 : Représentation circulaire des itemsets

Figure 7.4 – Position angulaire et distance des itemsets.

La position angulaire est comprise en entre 0 et 1. La distance angulaire est la valeur absolue de la plus petite différence des positions angulaires entre deux itemsets. Sa valeur maximale est donc égale à 0,5. Ainsi, les distances (AB) et (AD) sont respectivement de 0,25 et 0,375.

Les distances (BC) et (DE) sont égales à 0.

Cette énergie ULinLog est ensuite calculée sur chaque cercle Ci, pour obtenir la distance

résultante intra-cercles icd.

Définition 17 (icd) La distance intra-cercles est définie par :

icd =

N

X

i=1

ULinLog(Ci)

Où Ci est le cercle de rang i.

Distance extra-cercles

ecd est la distance extra-cercles. Elle considère la différence angulaire entre les itemsets

des différents cercles.

Définition 18 (da(u, w)) La distance angulaire entre deux nœuds d’un même cercle est définie

de la manière suivante :

• Nous appelons ap la position angulaire d’un nœud. La position nulle est celle d’un nœud

situé sur l’axe des abscisses positives d’un repère dont l’origine est le centre du cercle. Sa valeur, comprise entre 0 et 1, correspond à la fraction du cercle, quand le nœud se déplace sur celui-ci.

• La distance angulaire entre deux nœuds u et w est définie par :

da(u, w) = min(|ap(u) − ap(w)|, 1 − |ap(u) − ap(w)|)

La position angulaire d’un point est illustrée par la ligure 7.4. Par exemple, si l’angle est

π

2, alors elle est égale à 0.25 (Points B et C).

Comme les nœuds sont sur des cercles, la distance maximale est 0,5, selon que l’on considère le déplacement en tournant dans le sens des aiguilles d’une montre ou dans le sens inverse. Ainsi, la distance entre les points A et D est la valeur minimale entre |0 − 0, 625| et 1 − (0 − 0, 625), c’est-à-dire 0,375.

Définition 19 (ecd) La distance extra-cercles est définie de la manière suivante : • Considérant un cercle Ci, nous appelons adi la distance angulaire du cercle :

adi=

X

{(u,w)}∈Ei

da(u, w)

• La distance extra-cercle est alors définie par :

ecd =

i=N −1

X

i=1

adi

Elle calcule la somme des différences de position angulaire entre chaque paire d’itemsets qui sont liés, entre chaque cercle Ci et le suivant.

Distance globale

A partir des distances intra-cercles et extra-cercles, la distance résultante peut être définie.

Définition 20 (d) La distance globale du graphe est définie par :

d = icd + ecd

Pour que cette distance d soit optimale, elle doit être minimale, parce qu’elle indique alors une distance minimale entre les nœuds d’un même cluster, et maximale entre les nœuds de clusters différents. C’est ce que nous allons aborder dans la suite de ce chapitre.