Discussion - Techniques de visualisation employant de l’agrégation

3.3 Techniques de visualisation employant de l’agrégation

3.3.4 Discussion

Nous discutons ici de certaines caractéristiques structurelles des représentations pouvant influencer le respect des critères d’Elmqvist & Fekete.

Influence de la multidimensionnalité

Parmi les techniques synthétisées dans la Table 3.1, certaines, comme Triva/Viva, le

« task profile » et la « timeline » de Vampir, ne représentent que l’espace ou le temps.

Cette particularité a une forte influence sur l’analyse, puisqu’elle est responsable d’un lissage de la dimension agrégée (G5) : des représentations ne montrant pas l’espace des ressources de l’application ne permettent pas d’étudier l’influence de sa structure sur son comportement, tandis que les représentations s’affranchissant d’un axe temporel éprouvent des difficultés à mettre en évidence un comportement problématique loca-lisé dans le temps et sont plutôt destinées au profilage de l’application. L’absence d’une

3.3. TECHNIQUES DE VISUALISATION EMPLOYANT DE L’AGRÉGATION 35

Figure3.5 – Treemaps proposées par Viva [6] (ex-Triva [50]). Les représentations A sont un exemple d’agrégation selon la hiérarchie matérielle et logicielle. Les représentations B et C emploient de l’agrégation multirésolution. Le niveau de détail diminue quand p augmente.

Figure 3.6 – La « Scalable Topology-based Visualization » de Triva [49, 50], montrant la topologie de l’application, les nœuds, les liens, et leur taux d’utilisation.

36 CHAPITRE 3. AGRÉGATION ET PASSAGE À L’ÉCHELLE

Figure 3.7 – Le « task profile » de Vampir [48] regroupe les processus les plus ressem-blants et montre le temps moyen des fonctions associées aux processus agrégés au sein de la grappe.

dimension donne cependant l’opportunité de mieux maîtriser la place allouée à la repré-sentation.

À l’inverse, les représentations multidimensionnelles sont capables de lier la structure et le comportement temporel de l’application, mais ont plus de difficultés à satisfaire la contrainte liée au respect du budget des éléments graphiques (G1). En effet, la plupart des techniques d’agrégation employées traitent l’espace et le temps séparément, et de manière inégale. Les diagrammes espace-temps de Vampir [48], Jumpshot [81], Pajé [30], LTTng Eclipse viewer [44] et la Streamline d’ARM DS 5 [45] ne proposent pas d’agrégation spatiale. La technique d’agrégation hiérarchique de T-Charts [7] est relativement efficace, mais la compression temporelle n’est pas suffisante pour assurer le passage à l’échelle pour la représentation de la trace entière. Parmi les représentations multidimensionnelles, seul Paraver [80] est à même de proposer un diagramme espace-temps avec une agrégation dont le procédé est identique sur l’espace et le temps et qui respecte le critère G1. Cette constatation nous conduit à élaborer un nouveau critère que nous intégrons à la Table 3.1 : la cohérence du processus d’agrégation sur le temps et l’espace, que nous notonsM.

M. Cohérence de l’agrégation sur l’ensemble des dimensions Une agrégation est cohérente sur les deux dimensions si elle les agrège au cours d’un même processus³de telle sorte à ce que les paramètres liés à l’agrégation d’une des deux dimensions influent sur le résultat de l’agrégation de la seconde⁴. L’intérêt d’une agrégation cohérente est de considérer le maintien du budget d’entités (G1), à travers le processus de réduction de complexité, sur l’ensemble de la représentation, et non séparément sur chaque dimension.

3Cela ne signifie pas qu’elles sont forcément agrégées de la même manière.

4Mais il n’est pas nécessaire que les paramètres de l’agrégation de la seconde dimension influent sur le résultat de l’agrégation de la première pour considérer qu’il y a cohérence.

3.3. TECHNIQUES DE VISUALISATION EMPLOYANT DE L’AGRÉGATION 37 Les techniques proposant une vue d’ensemble monodimensionnelle remplissent M de par leur construction (le fait de ne pas montrer une dimension forçant à l’agréger complètement).

Conception d’une technique agrégation répondant à l’ensemble des critères de qualité

Nous avons discriminé un certain nombre de défauts liés aux techniques d’agrégation présentées. D’après ce constat, nous estimons qu’il est important que l’agrégation soit cohérente (M), en particulier dans le cas de représentations multidimensionnelles. Les techniques fondées sur l’agrégation de données sont globalement les plus satisfaisantes, quoique souffrant encore de certains défauts. L’agrégation multirésolution employée par Viva [5, 6] nous semble pertinente puisqu’elle est cohérente sur l’ensemble des dimen-sions, et permet de remplir la plupart des critères, hormis G1 pour certaines valeurs du compromis entre la réduction de complexité et la perte de d’information. Nous en-visageons d’employer la même méthode sur d’autres dimensions, en la complétant par des techniques d’agrégation visuelle pour assurer le critère G1. Nous estimons que ces dernières peuvent fournir un bon complément à l’agrégation de données : le processus de réduction de complexité étant déjà amorcé, elles ne sont appliquées que sur un en-semble restreint d’objets graphiques, ce qui limite la perte d’information (G5) dont elles souffrent habituellement.

Nous nous proposons donc, dans un premier temps, d’appliquer l’algorithme d’agré-gation d’un ensemble ordonné issu des travaux de Lamarche-Perrin à une analyse tem-porelle, en vue de l’analyse d’applications embarquées dont l’homogénéité temporelle est déterminante. Notre contribution ici est de l’adapter à l’analyse de traces en définis-sant comment construire l’entrée de l’algorithme, afin que ses structures et sa métrique soient adaptées à la représentation du comportement de l’application. Ce modèle micro-scopique étant plus complexe que ceux employés par les applications initiales de l’algo-rithme d’agrégation d’un ensemble ordonné, il est nécessaire d’adapter ce dernier à des attributs multidimensionnels. Laméthode de Lamarche-Perrin ne préconise pas comment visualiser la sortie de l’algorithme d’agrégation, si bien qu’il est nécessaire de concevoir des techniques de visualisation adaptées. Enfin, la réduction de complexité n’étant pas uniforme dans la représentation, nous ajoutons des mécanismes d’agrégation visuelle afin de remédier à la présence ponctuelle d’objets graphiques trop petits pour être affichés correctement. Bien que notre technique ne représente pas l’espace des ressources, nous n’agrégeons pas cette dimension lors de l’agrégation des données, afin de la prendre en compte pour déterminer comment agréger temporellement. Cela diffère de l’agrégation hiérarchique de Viva où le temps est complètement agrégé au travers d’une intégration temporelle. Dans un second temps, nous fusionnons l’agrégation temporelle et spatiale au sein d’un algorithme unique, proposant ainsi une méthode d’agrégation multidimen-sionnelle de données uniforme, également complétée par de l’agrégation visuelle.

Avant de décrire ces deux techniques d’analyse, nous présentons, Chapitre 4 une synthèse des travaux de Lamarche-Perrin afin de familiariser le lecteur aux concepts issus de sa méthode.

38 CHAPITRE 3. AGRÉGATION ET PASSAGE À L’ÉCHELLE

Table3.1 – Passage à l’échelle des techniques d’analyse spatiotemporelles implémentées dans les outils d’analyse de traces. Les critères d’Elmqvist & Fekete sont symbolisés par Gx, et le critère de cohérence multidimensionnelle par M. Un critère peut être satisfait : uniquement pour le temps (?), l’espace (◦) ou les deux dimensions (•). On symbolise l’agrégation de données par ], l’agrégation visuelle par[, et l’agrégation hybride par\.

Outil Visualisation

espace-temps • • Guidée par les

pixels\ ? • •

espace-temps • • Guidée par les pixels\

Treemap [52] • Intégration] Agrégation

hiérarchique] • • • • • •

CHAPITRE 4

Adaptation d’une méthode d’analyse macroscopique des grands systèmes à

l’analyse de traces

Lamarche-Perrin oppose deux approches visant à l’analyse d’un système multi-agents complexe de grande taille [8]. L’approche analytique considère chacun des constituants d’un système séparément, tandis que l’approche systémique l’appréhende dans sa glo-balité [82]. Selon lui, l’étude d’un système complexe n’est pas possible avec l’approche analytique : celle-ci nécessite des outils d’observations dont la taille est de l’ordre de celle du système, ce qui génère une quantité d’information, et donc de phénomènes microsco-piques à expliquer, trop importante pour un analyste. À l’inverse, l’approche systémique s’attache à « distinguer ce qui est important de ce qui est de l’ordre du détail », ou, en d’autres termes, à proposer « un point de vue macroscopique» [8], ce qui permet à l’analyste de ne pas être gêné par la taille du système à étudier.

Dans leurs travaux, Lamarche-Perrin et al. [8, 9, 83, 84, 85, 86, 87, 88] conçoivent une méthode permettant l’élaboration d’un point de vue macroscopique selon l’approche sys-témique. Elle part du postulat que le système est observé avec des outils microscopiques, et s’attache à répondre à la problématique de «mettre en évidence les phénomènes ma-croscopiques à partir des résultats de l’observation microscopique » [8]. Pour cela, la méthode s’appuie sur un processus d’abstraction des données microscopiques, reposant sur des techniques d’agrégations. Cette abstraction est élaborée en tenant compte du contexte de l’analyse et de connaissances à priori de l’observateur sur le système, ce qui permet d’engendrer une définition macroscopique représentant des phénomènes perti-nents pour l’analyste. Nous noterons l’ensemble du corpus conceptuel et méthodologique issu des ces travaux méthode de Lamarche-Perrin.

La définition que nous donnons d’une trace d’exécution d’un programme, Section 2.1, en fait un cas particulier d’un système multi-agents complexe, constitué d’entités et d’évè-nements produits par ces entités. Les problématiques soulevées par Lamarche-Perrin [8]

englobent ainsi celles du passage à l’échelle de l’analyse de traces basée sur la visualisa-tion, où il faut composer avec les capacités de calcul de la machine servant à l’analyse, les capacités graphiques de l’affichage et les capacités analytiques de l’observateur. Les

40 CHAPITRE 4. ANALYSE MACROSCOPIQUE DES GRANDS SYSTÈMES visualisations dont le passage à l’échelle est délicat, décrites en Section 2.3, se posi-tionnent du côté de l’approche analytique et souffrent de ses défauts. Nous proposons donc, dans cette thèse, d’aborder l’analyse et la visualisation de traces de grands volumes en employant une approche systémique, et, plus précisément, en suivant la méthode de Lamarche-Perrin.

Cette approche est adaptée à notre problème car elle n’est pas uniquement focalisée sur le passage à l’échelle : elle apporte une connaissance supplémentaire sur le compor-tement du système en discriminant l’homogénéité et l’hétérogénéité du comporcompor-tement des entités qui le composent. Cela est possible grâce à un compromis entre la réduction de complexité et la perte d’information, dont la résolution privilégie l’agrégation des élé-ments les plus homogènes — du point de vue de la théorie de l’information. L’homogénéité du comportement des applications embarquées temps réel au cours du temps nous in-téresse particulièrement, puisque les principales caractéristiques des dysfonctionnements liés à des pertes d’image ou à des artefacts sonores se manifestent par une rupture mo-mentanée du comportement normal de l’application, qui est censé être périodique. Dans le cas des applications parallèles, nous cherchons à discriminer des phases, et éventuel-lement des ruptures de comportement locales dues à des facteurs externes (contentions sur le réseau, par exemple) ou internes (interblocage, par exemple), ce qui se traduit aussi par la notion d’homogénéité temporelle. Concernant l’aspect structurel, l’étude de la répartition de la charge de travail, de la proportion de tâches ou de fonctions sur les ressources est un indicateur du bon dimensionnement de la plateforme, ou des mau-vaises performances d’une sous-partie du système. Là encore, la notion d’homogénéité comportementale est présente, au niveau spatiale cette fois-ci.

Dans ce chapitre, nous reprenons et synthétisons différents travaux [8, 9, 83, 84, 85, 86, 87, 88] pour en dégager les concepts principaux et les éléments clés de laméthode de Lamarche-Perrin. Nous détaillons le concept de modèle microscopique, une abstraction du système à étudier qui est le niveau le plus fin de l’analyse. Nous poursuivons par le processus de partitionnement et d’agrégation de ce modèle microscopique pour en générer une représentation moins complexe, et les propriétés qui caractérisent les agrégats composant cette représentation. Nous abordons les mesures de qualités, employées pour déterminer comment choisir une partition, puis les contraintes qui sont appliquées au processus de partitionnement, pour enfin finir par des exemples d’applications. Ces points sont essentiels pour aborder les chapitres 5 et 6, dans lesquels nous expliquons comment nous avons appliqué et adapté cette méthode pour l’intégrer dans un processus d’analyse de traces.

4.1 Formalisation du processus d’agrégation

Nous formalisons le processus d’agrégation de laméthode Lamarche-Perrinen définissant la représentation microscopique du système, son partitionnement et son agrégation.

Dans le document Agrégation spatiotemporelle pour la visualisation de traces d exécution (Page 47-53)