• Aucun résultat trouvé

Diagramme de Venn pour la visualisation des co-occurrences de tag

Ce travail a mené conjointement une problématique technique consistant à explorer les possibilités graphiques de la librairie JavaScript Protovis (Bostock & Heer, 2009, http://goo.gl/x8eJG), et deux problématiques théoriques consistant à s'interroger d'une part, sur l'exploration interactive des données comme solution aux problèmes du conditionnement de l'interprétation par le choix d'un type de visualisation, et d'autre part, celle de la lisibilité de l'information dans de grandes quantités de données. En effet, le calcul des visualisations est désormais accessible en temps réel par un simple navigateur Web. Pour donner une représentation visuelle aux données, plus besoin d'installer un logiciel particulier, ni de disposer d'une machine particulièrement performante. Le Web fournit à la fois les technologies et les données. Examinons avec un exemple précis, comment il est possible avec Protovis de modéliser une potentialité de représentation et de fournir à l'utilisateur la responsabilité du choix des représentations, afin de minimiser l'impact du designer sur le conditionnement de l'interprétation et de rendre plus lisible de grandes quantités d'informations.

Il est clair que la multiplication des données rend de plus en plus difficile voir impossible leur consultation. Même en menant des expériences sur un ordinateur avec un indice de performance élevé (5.9)33, nous avons rencontré des difficultés à visualiser des représentations calculées à partir d'une folksonomie Delicious contenant trop d'entrées. Malgré des filtres de taille, de plage d'occurrence et de date que nous avons ajouté pour remédier à ces problèmes, certaines visualisations n'ont pu être enregistrées ni même représentées à l'écran. La solution à ce problème que nous avons expérimenté dans ce travail consiste à explorer les données en multipliant les interactions avec des états graphiques.

Le principe général est équivalent à celui du parcours d'un espace que chaque pas reconfigure, chaque état graphique étant comme un point de vue particulier dans un paysage de données. Techniquement, cet espace constitue un hypertexte dont les nœuds, les ancres et les liens sont calculés dynamiquement suivant le potentiel de représentation (virtualité) et le choix de l'utilisateur (actualité). En tant que représentation d'un espace, cet hypertexte possède une dimension cartographique qui rend évidente l'utilisation des processus d'exploration que

Samuel Szoniecky Université Paris VIII - Saint-Denis 2009 - 2012

Buts et moyens de l'intelligence collective - Outils expérimentaux d'intelligence collective 152

sont le zoom et le déplacement. Nous avons trouvé au cours de notre exploration de Protovis, les fonctionnalités génériques que propose cette librairie pour répondre à ce besoin (http://goo.gl/DcSZz). Nous les avons mis en place pour visualiser des données sous forme de bulles (http://goo.gl/5sLld , Figure 38: Nuage de bulles à partir de Delicious p. 152) et d'arc (http://goo.gl/zEB8G). Ces possibilités de navigation restent toutefois limitées notamment lorsque les données sont trop nombreuses ou que le modèle de représentation ne les supporte pas. Il nous a donc fallu trouver d'autres moyens de représenter les données pour faciliter leurs explorations.

Figure 38: Nuage de bulles à partir de Delicious

Pour expérimenter ces nouvelles possibilités nous prendrons l'exemple du tag « DHYP » utilisé par cinq enseignants du département Hypermédia de l'Université Paris 834. Le scénario que nous proposons a pour but de permettre une exploration la plus détaillée possible des données sans être bloqué par des problèmes de performance ou de lisibilités des données. Pour cela, nous suivons une démarche allant du plus englobant, c'est à dire l'enseignant, au plus détaillé, c'est à dire le tag.

Commençons donc par proposer à l'utilisateur de choisir quels enseignants devront être pris en compte pour les visualisations. Dans le cas qui nous occupe, le nombre d'enseignants étant relativement restreint nous avons utilisé un diagramme de Venn pour modéliser graphiquement une des 30 possibilités de permutation des cinq enseignants. Comme le remarque Jérôme Thièvre dans sa thèse d'informatique sur la cartographie pour la recherche d'information :

Buts et moyens de l'intelligence collective - Outils expérimentaux d'intelligence collective 153

« La formulation par diagrammes de Venn est supérieure à la formulation textuelle, car elle rend impossible les erreurs structurelles liées au parenthésage des expressions booléennes, et permet d’éviter les problèmes liés à la mauvaise interprétation de la sémantique des opérateurs booléens. En effet, le sens des opérateurs booléens ET et OU est parfois confondu avec le sens des conjonctions de coordination et et ou du langage naturel. Ainsi l’opérateur disjonctif OU est fréquemment interprété comme exclusif. L’opérateur conjonctif ET est quant à lui parfois interprété comme une union plutôt que comme une intersection. » (Thièvre, 2006, p. 33)

Plutôt que de choisir en plusieurs clics dans un formulaire de choix par cases à cocher, il apparaît plus ergonomique de permettre à l'utilisateur de choisir en un clic dans un diagramme de Venn (Figure 39 p. 153) :

Figure 39 : Diagramme de Venn, formulaire de choix

Une première difficulté consiste à construire ce graphique. Idéalement, pour rester cohérent avec la librairie Protovis, il faudrait créer un nouveau « layout » (http://goo.gl/kLNdL) implémentant les algorithmes de création dynamique de diagramme de Venn et d'Euler (Thièvre, 2006 ; Ruskey & Weston, 2005). De façon plus simple et rapide, nous avons vectorisé manuellement avec le logiciel Inkscape (http://goo.gl/gnnhj), chaque élément du graphique ci-dessus, en l'indexant avec un identifiant correspond à une des 30 permutations : v_1, v_1_2, v_1_2_3, etc... Ainsi, nous avons pu coordonner les éléments du graphique avec une sémantique particulière, par exemple pour filtrer les tags par rapport aux enseignants qui les utilisent : v_1 = uniquement l'enseignant 1, v_1_2 = les enseignants 1 ET 2, etc...

Nous avons ensuite développé sous la forme d'un service Web un algorithme qui renvoie dans un tableau, le nombre de tag qu'un groupe d'utilisateurs a en commun par rapport aux co- occurrences d'un tag. Les données que nous obtenons, nous permettent alors de construire une page en deux parties (http://goo.gl/UeXfa, Figure 40 p. 154). A gauche, le diagramme de

Samuel Szoniecky Université Paris VIII - Saint-Denis 2009 - 2012

Buts et moyens de l'intelligence collective - Outils expérimentaux d'intelligence collective 154

Venn dont la couleur des éléments graphiques correspond au nombre d'occurrences de la permutation, permet de mettre à jour la partie droite en cliquant sur un élément. Pour rendre ce diagramme dynamique et interactif nous utilisons l'algorithme suivant :

• Pour chaque permutation :

o construction de l'identifiant et du libellé de l'élément SVG o récupération de l'élément SVG

o suppression du style par défaut s'il existe o calcul de la couleur avec la librairie Protovis

o modification de la couleur de l'élément suivant le nombre de lien o ajout des événements de mise à jour de la partie droite

Figure 40 : Diagramme de Venn : exemple d’interaction

Le diagramme de Venn fonctionne comme une boussole qui permet de localiser sémantiquement une plage de données. Pour ce faire, on change automatiquement en vert la couleur de fond de l'élément. Parallèlement, une donnée peut être située dans le système de coordonnées organisé par le diagramme. Nous concevons chaque diagramme comme une existence dans un écosystème. Ainsi un événement sur un diagramme entraine des répercussions sur les autres diagrammes et vice-versa. Toutefois, dans l'exemple que nous présentons cette interaction ne se fait que dans le sens du global vers le détaillé. Les événements sur un diagramme « parent » entrainent des modifications sur un diagramme « enfant » mais pas l'inverse. Pour une mise à jour du « détail-enfant » vers le « global- parent », il est nécessaire de mettre en place des fonctionnalités pour la modification des données brutes. Dans notre cas, les données brutes sont toujours les mêmes, seules les données de visualisations changent. Il n'y a donc pas de boucle rétroactive sur les données brutes comme c'est le cas dans un écosystème naturel où toutes modifications d'une existence entraînent des répercussions sur les autres existences.

Buts et moyens de l'intelligence collective - Outils expérimentaux d'intelligence collective 155

Figure 41: Diagramme de Venn pour la sélection des permutations

Pour explorer les données brutes que nous avons générées, voici les règles que nous avons adoptées dans le moteur de visualisation que nous avons développé (http://goo.gl/C54Ps) :

• Diagramme de Venn : il présente l'intégralité des données subdivisée en 30 permutations (Figure 41 p. 155)

• La représentation d'une des distributions par rapport à trois dimensions (Figure 42 p. 156) :

o le nombre de fois ou une co-occurrence entre deux tags est utilisée, o le nombre de fois ou le tag est utilisé,

o le nombre de document associé à un tag

• Le filtrage des données brutes pour chaque élément des trois dimensions

Un clic sur un des éléments d'une des trois dimensions entraîne le filtrage des données brutes par rapport à cet élément. Par défaut, toutes les données sont affichées sauf pour les permutations comportant un trop grand nombre de données (contours rouge). Dans ce cas, seuls les trois premiers éléments de chaque dimension sont affichés.

Samuel Szoniecky Université Paris VIII - Saint-Denis 2009 - 2012

Buts et moyens de l'intelligence collective - Outils expérimentaux d'intelligence collective 156

Figure 42: Interface de filtrage des données

Ce scénario de visualisation est un exemple parmi tant d'autres de ce qu'il est possible de faire pour permettre à un utilisateur d'explorer un corpus de données et lui donner du sens à partir de règles génératives permettant de construire une interprétation. La conception des visualisations tend de plus en plus vers la mise à disposition d'un « potentiel » de représentation ou, pour dire autrement, l'objectif est de modéliser un réseau de virtualité. Dans ce contexte, une visualisation devient l'actualité d'une virtualité ; le designer ayant pour tâche de définir les contraintes de virtualisation, l'utilisateur celle de choisir parmi ces contraintes lesquelles seront actualisées. Ainsi, le métier du designer consiste à définir un réseau de perspectives dans lequel l'utilisateur choisit un point de vue particulier. En ce sens, l'interprétation d'une information est conditionnée en premier lieu par le designer qui modélise l'amplitude des potentialités et en dernière instance par l'utilisateur qui choisit telles ou telles contraintes de visualisation.

Buts et moyens de l'intelligence collective - Outils expérimentaux d'intelligence collective 157

3.

Tweet Palette : cartographie sémantique pour tagger un