• Aucun résultat trouvé

multidimensionnels dynamiques

6.2 Visualisation d’états en contexte

6.2.2 Mise en exergue des éléments communs

Les éléments qui ne présentent pas de changements selon un critère sur le contexte sont appelés éléments communs. Un nœud peut être commun à tous les états du contexte, tandis qu’un de ses attributs va présenter des variations sur ces mêmes états du GMD. Les éléments communs s’identifient en opposition à la présence de changements. Dans le cas de propriétés des éléments qui ne sont pas binaires, ce sont les éléments qui présentent des changements minimum qui sont recherchés.

Figure 6.11 – État d’un graphe sur lequel ont été calculées des valeurs CCprev et CCnext par rapport aux états précédent et suivant. a) CCnext et CCprev sont additionnées pour définir le rayon des nœuds. b) Les nœuds sont représentés par deux demi-disques dont les rayons sont définis respectivement par CCprev (gauche) et CCnext (droite). [graphe réalisé à la main : au moment de la rédaction de ce manuscrit, la fonctionnalité n’est pas encore disponible sur l’interface SwoViewer]

Nous décrivons dans cette sous-section la recherche d’éléments communs appliquée à deux types de critères : la stabilité topologique individuelle d’un élément et l’appartenance d’un élément à une structure commune.

6.2.2.1 Identification des éléments stables

Dans cette sous-section sont présentés le vocabulaire et les critères de définition associés à l’identification des éléments stables, d’un point de vue topologique, d’un GMD sur son contexte. Des critères de stabilité basés sur les attributs des éléments pourraient être définis de façon similaire.

Nœuds actifs et inactifs pour un état : un nœud actif possède un nombre de connexions élevé avec les autres nœuds du graphe.

Un nœud inactif possède un faible nombre de connexions avec les nœuds du graphe, voire aucune connexion.

Nœuds stables sur une dimension : un nœud stable présente peu de variations dans ses connexions. La quantité de connexions est donnée par la moyenne des degrés du nœuds sur l’ensemble des états de la dimension. Cette variation peut être mesurée par plusieurs indicateurs – qu’on appellera indicateurs de stabilité –, selon ce que l’on veut mettre en évidence :

– Écart-type sur la moyenne des degrés du nœud pour l’ensemble des états.

– Somme des mesures de change centrality (implique que la ou les dimensions du contexte soient ordonnées).

état 1 état 2 état 3 état 4 moyenne écart-type

e1 non-filtré 0.92 0.31 0.9 0.99 0.78 0.273

filtré ≥ 0.9 0.92 - 0.9 0.99 0.94 0.038

e2 non-filtré 0.92 0.93 0.88 0.8 0.8825 0.051

filtré ≥ 0.9 0.92 0.93 - - 0.925 0.005

Table 6.2 – Poids des arêtes e1 et e2 en fonction de quatre états, accompagnés des valeurs de la moyenne et de l’écart type avec et sans filtre à poids ≥ 0.9.

Un nœud inactif est constant si l’écart-type liée à la moyenne des degrés du nœud est faible.

Il est possible de déterminer des classes de nœuds stables pour mieux observer. On appelle l’identifiant de cette classe degré de stabilité des nœuds.

Arêtes stables : une arête est stable à la fois si son existence et son poids sont stables sur l’ensemble de son existence.

Tendances des arêtes pondérées Il peut être intéressant d’étudier cette tendance à la fois sur le graphe filtré que sur le graphe non filtré en pondération. Un filtre sur la pondération (des arêtes ou des nœuds) introduit potentiellement un biais : si la limite est fixée à 1,05 inclus, que peut-on dire de l’élément dont le poids vaut 1,049 ? Ainsi, si un graphe possède quatre états selon une dimension et que l’on considère les arêtes e1 et e2, e1 est existe dans trois états sur quatre, tandis que e2 existe dans deux états sur quatre. Peut-on en déduire que e1 est plus stable que e2 ? A première vue oui, mais si on s’intéresse aux valeurs pondérées non filtrées, il est possible de s’apercevoir que e2 est plus stable que e1.

La table 6.2 présente en exemple les poids de deux arêtes e1 et e2 sur quatre états. Après l’application du filtre, en regardant uniquement l’existence sur les arêtes, c’est e1 qui est la plus stable. Si on s’intéresse à la stabilité liée au poids sur le graphe non-filtré, c’est alors l’arête e2 qui apparait la plus stable.

Si on étudie dans son contexte l’état 2 sur le graphe filtré, et qu’on visualise la naissance et la mort des arêtes, e1 et e2 apparaissent toutes les deux en rouge. Pour certaines analyses, ce constat est suffisant. Pour des explorations plus fines, il devient indispensable d’indiquer que l’arête disparait pour une raison forte – la valeur du poids est très éloignée de la valeur du filtre – ou faible – la valeur du poids est très proche de la valeur du filtre. Un moyen simple de visualiser la quantité d’accroissement ou de décroissance en valeur absolue du poids de l’arête est de jouer sur l’épaisseur de l’arête. Un exemple d’une telle visualisation est donné en figure 6.12, on y voit que l’arête e1 disparait à l’état 2 suite à une forte décroissance de son poids, comparativement à l’arête e2 qui disparait à l’état 3 suite à une décroissance faible de son poids.

6.2.2.2 Identification des groupes communs

La difficulté d’identifier des groupes de nœuds communs dans un contexte survient quand le nombre et la taille des groupes varient entre les états du contexte. Comparer deux groupes

State 1 State 2 State 3 State 4

Figure 6.12 – Visualisation en contexte d’un graphe à trois nœuds {node1; node2; node3; node4} et deux arêtes {e1 : node1 − node2; e2 : node2 − node3} en fonction de quatre états (données issues de la table6.2). La naissance et la mort des éléments du graphe sont mis en exergue par la couleur (technique présentée dans la sous-section6.2.1.1). La variation du poids en contexte de l’arête est représenté par sa taille.

revient alors à calculer le nombre de nœuds du plus petit groupe effectivement inclus dans le plus grand groupe, par rapport à la taille du plus petit groupe. La mesure ainsi obtenue est exprimée en pourcentage. Le mécanisme est inchangé quand les deux groupes sont de taille identique : le petit groupe et le grand groupe sont déterminés arbitrairement.

La comparaison de deux groupes est booléenne, selon une seuil de similitude en pourcentage donné par le paramètre perSimi. Pour que les deux groupes soient comparables, la taille du petit groupe ne doit pas être trop faible par rapport à la taille du grand groupe. Cette proportion est définie par le paramètre perSize en entrée de l’algorithme. L’algorithme de comparaison de deux groupes est présenté en pseudo-code dans le bloc 1de l’annexe J.

Pour étendre cette comparaison simple au contexte d’un état, il s’agit de chercher les nœuds communs d’un groupe pour chaque état du contexte. L’ensemble de ces nœuds pour un groupe donné est appelé motif. L’algorithme2 de l’annexe Jprésente comment obtenir les motifs d’un contexte.

L’instabilité des nœuds est mesurée à partir des motifs identifiés. Elle est obtenue en faisant la somme des écarts du nombre de nœuds groupe-motif pour chaque état du contexte et de état courant, divisé par la somme des nœuds du groupe pour chaque état. Pour nbm : nombre de nœuds dans le motif, nbi : nombre de nœuds du groupe de l’état i du contexte, nbc: nombre de nœuds dans le groupe de l’état courant :

instability = (nbc− nbm) + (nb0− nbm) + ... + (nbimax− nbm)

nbc+ nb0+ ... + nbimax (6.2)

L’instabilité vaut :

tous les états du contexte.

– 1 quand il y a instabilité totale : aucun nœud du groupe est présent dans tous les états du contexte. Par exemple pour quatre groupes suivants : état1={1,2,4}, état1={1,2,3}, état1={2,3,4} et état1={1,3,4} les groupes sont identifiés communs pour perSimi = 60%, et pourtant aucun nœud du groupe n’est commun aux quatre états : le motif est vide et l’instabilité vaut 1.

12 quand il y a exactement autant de nœuds dans le motif que de nœuds en-dehors. La mesure de l’instabilité du groupe permet de renseigner sur sa qualité, et par conséquent est un bon indicateur pour orienter le choix des critères de recherche des groupes communs et des motifs.

6.3 Analyse des tendances dimensionnelles

Dans cette section nous nous intéressons à l’étude des événements agrégés sur une ou plu-sieurs dimensions. Dans un premier temps, le calcul du graphe de synthèse est présenté : il contient les valeurs de synthèse des éléments du graphe sur toutes les dimensions et la propriété de constance des éléments. L’application du Layout à Contraintes (LàC) sur l’ensemble des états du GMD à partir de l’étape précédente de réduction des données est détaillée. Pour finir, la détermination et l’impact des paramètres de préparation des données sur l’exploration finale sont discutés.