Graphes, diagrammes et arborescences pour l’accès aux vidéothèques numériques
Marie-Luce Viaud — Jérôme Thièvre — Agnès Saulnier
INA - DRE
4 avenue de l’Europe F-94366 Bry Sur Marne
{mlviaud, jthievre, asaulnier} @ina.fr
RÉSUMÉ.Avec le développement d’Internet et de la numérisation, les bibliothèques doivent compléter leur offre classique par des offres d’accès en ligne. Si les bibliothèques traditionnelles garantissent une assistance humaine pour les utilisateurs, un des enjeux des bibliothèques numériques est d’offrir des outils d’interface conviviaux pour explorer, naviguer et comprendre l’espace d’information structuré que constituent les ressources documentaires. Dans ce cadre, la visualisation interactive dispose de propriétés intéressantes comme la perception instantanée de groupes, de relations ou de répartitions, ou encore le contrôle de la représentation dans une boucle action/visualisation. Cet article décrit une suite d’outils interactifs de visualisation cartographique, génériques, paramétrables et combinables entre eux, destinés à fournir une meilleure compréhension des ressources et de leur organisation. Ces outils permettent de représenter des listes d’autorité, des thésaurus, des résultats de requêtes ou des cartographies thématiques de corpus, sous forme d’arborescences, de graphes ou de diagrammes.
ABSTRACT. The digital evolution of the last 10 years leads to a real increase of online resources, including digital libraries. In order to guarantee the quality access, librarians classify, describe, document, and catalog their resources. Classic libraries offer human users assistance to apprehend their organization. Then a challenge for digital libraries is to provide efficient and user friendly tools for a deep and shallow navigation. Interactive visualization shows interesting properties for these tasks. Indeed, the vision process includes preattentive perception of groups of entities, relation and repartition; and interaction allows control feedback through the action/visualization loop. This paper describes a set of generic tools providing cartographies using graphs or diagrams to enhance the understanding of libraries resources and organization.
MOTS-CLÉS: visualisation d’information, dessin et filtrage de graphes, diagrammes d’Euler.
KEYWORDS: information visualization, graphs layout and filtering, Euler diagrams.
1. Introduction
Dans le contexte actuel, où le WWW en tant qu’espace public constitue un immense réservoir de connaissances, il convient de s’interroger sur la fonction et le rôle des bibliothèques numériques. Selon la fédération des bibliothèques numériques (www.diglib.org), « les bibliothèques numériques sont des organisations qui fournissent des ressources, dont du personnel spécialisé, pour sélectionner, structurer, rendre accessibles intellectuellement, interpréter, distribuer, préserver l’intégrité et la persistance dans le temps de collections d’œuvres digitales afin de les rendre lisibles et économiquement accessibles pour une communauté ou un ensemble de communautés d’utilisateurs ». Cette définition fait émerger deux différences fondamentales entre la « toile » et les bibliothèques numériques. D’une part, la bibliothèque est une organisation dont le rôle est de contrôler, de valider et de préserver ses ressources selon des critères explicites, en général spécifiés dans son cahier des charges. D’autre part, cette organisation possède un devoir d’accès auprès de communautés, incluant la notion d’assistance par du personnel spécialisé.
Par ces contraintes, la bibliothèque numérique assure à ses utilisateurs une qualité et une fiabilité d’usage, tant au niveau de ses ressources que de leur accès. Si les devoirs des bibliothèques n’ont pas changé au passage à l’ère numérique, les outils à mettre en œuvre pour les satisfaire se sont quant à eux profondément modifiés.
L’institut national de l’audiovisuel a pour missions la conservation, l’exploitation, la mise à disposition du patrimoine audiovisuel et radiophonique auprès des professionnels de l’audiovisuel, ainsi que l’accompagnement des évolutions du secteur audiovisuel au travers de ses activités de recherche, de formation et de production. Au sein de l’INA, l’Inathèque de France est chargée, au terme de la loi du 20 juin 1992 relative au dépôt légal et du décret d’application du 31 décembre 1993, de collecter et de conserver les documents sonores et audiovisuels radiodiffusés ou télédiffusés. L’INA contient plus de 1 millions d’heures de télévision, 1 million d’heures de radio, et 1,5 million de photos, sur des supports aussi divers que des disques 78 tours, des kinescopes, des bandes 2 pouces, ou des films nitrates… et enfin, des supports numériques. L’INA, première banque d’images et de sons numérisés au monde (25 0000 heures de télévision et de radio sont actuellement disponibles en numérique) est, de par la nature de ses ressources, au cœur de cette mutation numérique.
Il y a 12 ans, les recherches effectuées dans les archives se faisaient presque en totalité par l’intermédiaire des documentalistes de l’INA qui, recevant des demandes écrites ou téléphoniques, livraient les documents sous forme de copies cassettes : le système documentaire ne disposait que d’un accès interne. Depuis, l’INA a développé une politique d’ouverture en plusieurs temps, afin de faire évoluer ses systèmes et ses pratiques. Depuis 1994, les archives radio et audiovisuelles sont accessibles à un public de chercheurs au sein de l’Inathèque de France, située à la BNF. Dans ce cadre, les chercheurs ont accès à des logiciels de consultation et de recherche professionnels, et des documentalistes de l’INA sont disponibles pour les
aider dans leur recherche. Depuis 2003, l’INA propose aux professionnels de l’audiovisuel le service INAMEDIA, qui permet la consultation en ligne de l’ensemble des ressources documentaires incluant la visualisation en ligne des programmes numérisés. Enfin, depuis avril 2006, l’INA met en ligne sur son site web, une offre grand public de 5 000 heures de programmes. Cette offre augmentera de 5 000 heures par an et propose des extraits, des collections ou des intégrales, accompagnés d’un point de vue rédactionnel.
La numérisation et l’élargissement de l’offre en ligne à un public de plus en plus large incitent à repenser les accès à l’ensemble du système documentaire. La numérisation des images, sons et vidéos a pour conséquence une uniformisation des supports et donc une intégration de toutes les étapes du processus d’archivage au sein d’un même système : l’outil informatique permet de capter, stocker, classer, indexer, restaurer, rechercher et diffuser tous les types de documents. D’un point de vue interne, cette évolution permet l’émergence de fonctionnalités d’analyse et de contrôle à différents niveaux du système d’archivage comme par exemple, le contrôle des images diffusées, le contrôle des termes du thésaurus, ou encore l’analyse des usages… D’autre part, l’ouverture de la consultation en ligne demande de repenser les accès à un système documentaire spécifique, complexe, structuré et performant, pour un public habitué au web. Plutôt que de simplifier l’accès aux données, il s’agit d’accompagner l’utilisateur dans l’appréhension de ce système complexe afin qu’il puisse l’exploiter au niveau de qualité désiré. Une des étapes de ces migrations, encore balbutiantes mais à fort potentiel, est l’utilisation de la visualisation. Nous présentons dans cet article des outils de visualisation destinés à montrer globalement ou localement l’organisation des données à des niveaux diverses. Selon le public et les données visualisées, ces outils serviront à contrôler, analyser, rechercher ou parcourir les ressources documentaires.
2. Perception visuelle et interactivité : l’intérêt des interfaces visuelles
D’un point de vue perceptif, la puissance des systèmes graphiques est reconnue depuis longtemps. A l’origine, les cartes étaient conçues pour reproduire la réalité.
Depuis, de nombreux systèmes de représentations graphiques ont été développés pour traiter des données abstraites. La visualisation d’information est définie dans (Gershon et al., 1995) comme « un processus de transformation de données et d’information non spatiales, en une forme visuelle permettant à l’utilisateur de les appréhender et les comprendre »1. Son but est d’utiliser nos capacités visuelles extrêmement performantes pour percevoir, analyser et mémoriser plus facilement des données abstraites complexes. Deux types de perceptions visuelles peuvent être distingués : la perception instantanée ou préattentive et la perception attentive (Tufte, 1992 ; Ware, 2004). La perception est qualifiée de préattentive lorsqu’elle
1. A process of transforming data and information that are not inherently spatial, into a visual form allowing the user to observe and understand the information.
s’effectue en un temps très court, de l’ordre du dixième de seconde. Elle ne dépend pas du nombre d’objets présents, et concerne un certain nombre d’opérations visuelles de base, comme l’identification de groupes d’entités ayant une identité graphique (couleur ou forme par exemple), la perception de regroupements spatiaux ou encore l’association d’un ordre ou d’une valeur quantitative à un ensemble grâce à l’attribution d’une valeur graphique (taille ou de couleur) (Bertin, 1967). La perception visuelle attentive s’effectue sur un temps plus long et peut être composée de plusieurs éléments de perception préattentive. Elle favorise la sélection et la mémorisation des ressources nécessaires au processus de cognition et constitue, de ce fait, une approche extrêmement efficace pour l’appréhension des données nécessaires à une analyse ou un raisonnement (Larkin, 1987). D’autre part, l’informatique a introduit la notion d’interaction en tant qu’instrument instantané de manipulation des données. Selon le psychologue J.J. Gibson (Gibson, 1977), il faut agir pour percevoir et percevoir pour agir. La visualisation interactive permet à l’utilisateur de contrôler la représentation des données dans une boucle action/perception. L’utilisateur appréhende les données en manipulant leur représentation en fonction de ses objectifs. Il se construit une représentation mentale des propriétés à analyser. De par ces possibilités, la visualisation interactive ajoute à la fonction d’inventaire et de communication, une fonction de traitement et d’analyse de l’information.
Le réseau d’excellence européen Delos (www.delos.info) (Bertini et al., 2005) a publié une étude qui établit les besoins d’interfaces visuelles pour les bibliothèques et les relie aux approches disponibles en visualisation interactive d’information. Les besoins listés s’articulent autour de 4 préoccupations majeures : la représentation des structures documentaires pour en faciliter la gestion (analyse, contrôle et mise à jour), la représentation globale des connaissances qui permettrait d’analyser et de naviguer dans les contenus et résultats de requête, l’étude du comportement utilisateur (statistiques d’accès, profil utilisateur, gestion des préférences…), et les interfaces collaboratives. Nos travaux s’intéressent principalement aux deux premiers aspects. Ils sont appliqués aux problématiques spécifiques des bibliothèques audiovisuelles et tout particulièrement de l’INA.
3. Visualisation : état de l’art, contraintes et choix
Notre champ d’étude porte donc sur des ensembles de documents structurés, qui contiennent une organisation sous-jacente définie par une indexation préalable.
Nous cherchons à assister l’utilisateur essentiellement pour 3 tâches : comprendre les structurations documentaires et leur évolution, rechercher et naviguer dans de grandes quantité d’information, contrôler et analyser des ensembles de documents et leur contexte. Notre approche consiste à fournir à l’utilisateur des représentations schématiques interactivement transformables afin d’appréhender et de manipuler les structures, les ressources, les corrélations entre entités… Pour ce faire, les outils de
visualisation interactive mis à leur disposition reposent essentiellement sur quatre fonctions de base : représentation, navigation, sélection et filtrage.
Paradoxalement, le mode d’accès aux ressources dans le contexte des vidéothèques numériques est encore essentiellement de type textuel. En effet, si la recherche en traitement d’images et de sons s’oriente, avec déjà quelques succès (Everingham et al., 1989 ; Joly et al., 2005), sur des accès de type contenus
« image » ou « son », les résultats2 sont encore trop ponctuels pour être mis en exploitation dans le cas de la vidéo. Les utilisateurs, professionnels ou grand public, sont habitués à utiliser des interfaces constituées essentiellement de textes et de listes textuelles. L’idée est de leur proposer différents types de représentations spatialisées de leurs données sans pour autant transformer leurs habitudes et leurs repères. Ainsi, nos interfaces mettent en œuvre deux espaces de représentation des données : un espace d’affichage qui représente les données abstraites sous la forme d’une table d’attributs lisibles, et un espace de représentation graphique qui supporte plusieurs types de représentation.
L’espace d’affichage des données abstraites se présente sous la forme d’un tableau, dont les lignes correspondent aux éléments à visualiser et les colonnes aux attributs qui décrivent chaque élément. Les attributs peuvent être des objets de type textuel numérique, date ou autre. Chaque type d’objet dispose d’une relation d’ordre et l’utilisateur peut sélectionner un attribut et réordonner la table pour satisfaire la relation d’ordre associée à cet attribut. Ainsi, les éléments sont triés par ordre décroissant dans le cas de données numériques, alphabétique pour des données textuelles, chronologique dans le cas de dates, etc. Plusieurs attributs peuvent être choisis pour obtenir un critère de tri multiple. La figure 6 donne des exemples d’attributs (label, occurrence dans l’ensemble considéré…).
La vue graphique est calculée en fonction du mode de représentation choisi et de la topologie des données. Elle contient donc des informations spatiales, topologiques et des attributs visuels (forme, taille, couleur, texture…). Des indices de mesures peuvent être calculés par rapport à la topologie ou la position spatiale des éléments et intégrés comme attributs dans le tableau des données. Dans le cas de l’arborescence (cf. figure 2), la distance à la racine constitue un attribut topologique.
Pour les graphes, l’indice de centralité d’un nœud ou d’une arête peut constituer un attribut topologique.
Le filtrage s’effectue en supprimant temporairement ou définitivement des éléments en fonction d’une ou plusieurs valeurs d’attribut et de seuils contrôlés par l’utilisateur. Tout filtrage est réversible. Cette approche permet d’alterner et de combiner les types de filtrage tout en contrôlant relativement aisément leur impact sur les données. Cet aspect sera abordé plus en détail dans la description de la visualisation de graphes.
2. Pour ce qui concerne l’image fixe, certains moteurs de recherche orientés contenu image donnent déjà des résultats très intéressants (http://wwwrocq.inria.fr/imedia/WebDemo).
La sélection peut s’effectuer par l’intermédiaire d’une sélection directe dans l’espace graphique ou dans l’espace d’affichage ou encore par l’intermédiaire d’un moteur de recherche sur l’ensemble des données abstraites. Tout attribut du tableau des données abstraites est interactivement associable à un attribut graphique. Cette propriété rend la représentation graphique totalement paramétrable en fonction de ce que l’utilisateur désire faire ressortir de la visualisation.
Les outils disposent de fonctionnalités graphiques standard de zoom, de déplacement ou de loupes. Ils sont développés en JAVA et sont conçus pour se combiner afin de permettre la réalisation de tâches réelles complexes.
4. Structures documentaires et visualisation d’arborescences
Les bibliothèques doivent apporter l’aide nécessaire à leurs utilisateurs au cours de la consultation. Les structures documentaires sont complexes mais représentent un point d’accès essentiel pour comprendre l’organisation et le contenu des bibliothèques. A l’heure où une grande part des consultations commence à s’effectuer en ligne, un enjeu de taille est d’assurer la continuité sémantique entre les processus d’indexation et de recherche. L’élargissement de la consultation en ligne rend difficile l’intervention directe de professionnels de la documentation.
Aussi, la création d’interfaces conviviales de consultation de ces structures paraît- elle constituer un nouvel élément incontournable du service d’assistance aux utilisateurs.
Une des spécificités des bibliothèques réside dans leur cœur de métier documentaire, à savoir la gestion des contenus en fonction de critères multiples soigneusement étudiés. Ces critères décrivent les documents au niveau sémantique mais aussi en termes de formats, de droits d’accès, de disponibilités, d’appartenance à des collections, éventuellement d’aspects marketing et commerciaux ou de matériels…. En effet, le rôle de la documentation est de positionner le nouveau document dans l’ensemble des ressources par l’attribution de données descriptives.
Cet ensemble d’information structure les ressources et permet de définir le contexte de l’offre proposée. Dans le cas de ressources audiovisuelles, le travail documentaire constitue une part importante du travail d’archivage : contrairement aux ressources textuelles, les ressources audiovisuelles ne s’autodécrivent pas encore3. Ainsi, chaque document est décrit, au niveau d’archivage recommandé, par une notice documentaire textuelle créée par des documentalistes et intégrée dans une base de données pour en permettre l’accès.
3. De grands champs de recherche (transcription automatique, indexation d’images…) ont pour but d’analyser des flux sonores ou audiovisuels afin d’en produire une description automatique. Si ces techniques ne présentent pas une qualité suffisante pour être exploitées au niveau de qualité exigé pour la documentation, elles peuvent déjà constituer un point d’accès intéressant si aucune indexation n’est disponible.
La garantie « qualité » d’une bibliothèque en termes d’accès sémantique réside en partie dans le paradigme suivant : toute œuvre inaccessible est une œuvre perdue.
Or, sans prendre en compte les compétences des utilisateurs, deux phénomènes peuvent rendre une œuvre documentée inaccessible. Lorsqu’un document représentant une réponse pertinente à une requête se trouve mêlé à un trop grand nombre de documents résultats de plus faible pertinence, l’utilisateur ne peut plus analyser les résultats et atteindre sa cible : il est confronté au bruit documentaire. A l’opposé, si aucun document résultat ne répond à une requête correctement formulée et dans les domaines couverts par la bibliothèque, l’utilisateur est confronté au silence documentaire. Un « bon » système documentaire doit minimiser le bruit en garantissant que tous les documents résultats d’une requête sont pertinents, et le silence en assurant que la grande majorité (dans l’idéal la totalité) des documents pertinents est présente dans l’ensemble résultat. C’est la structuration sémantique et catégorielle des contenus qui constitue la réponse « métier » des bibliothèques à cette problématique.
Généralement, le langage naturel n’est pas interprétable de manière univoque.
Aussi, les bibliothèques ont-elles élaboré des langages documentaires afin de produire des descriptions formalisées et normalisées de leurs ressources. Les quelques exemples suivant illustrent l’ambiguïté d’interprétation du langage naturel et la nécessité de la structuration documentaire. Le terme « PARIS », posé comme requête en texte libre sur tous les champs de notices donne pour résultat un ensemble de… quelques centaines de milliers de documents ! En effet, les notices peuvent contenir « PARIS » comme lieu de production, de tournage, d’événement, comme sujet architectural, social... Dans le monde télévisuel, il est relativement fréquent qu’un intervenant possède des rôles multiples tel M. Drucker : présentateur, producteur d’émissions, invité et même quelques fois interprète... La polysémie peut aussi générer du bruit documentaire : virus est actuellement employé dans le domaine médical et informatique. Dans ces trois cas, une désambiguïsation rapide peut s’effectuer grâce à la structuration documentaire, soit en posant la requête « PARIS » en précisant le champ d’indexation correspondant à la requête désirée, soit en spécifiant le type de rôle de la personne, soit en considérant le terme
« père » dans la structure hiérarchique que constitue le thésaurus.
Les connaissances4 qui servent à décrire le contenu des ressources de l’INA se présentent sous forme de listes spécifiques et de thésaurus. Les listes peuvent être de différents types, comme la liste des métiers de l’audiovisuels, des matériaux supports, des canaux de diffusion… Un thésaurus est un ensemble de termes organisés en arborescence et contenant des liens transversaux de type « voir aussi », des informations de synonymie ou de précision. Le thésaurus des noms communs
4. Si les approches ontologiques apparaissent prometteuses, elles sont pour le moment difficiles à mettre en œuvre, tout particulièrement pour des bibliothèques généralistes comme l’INA. En effet, la modélisation des concepts et de leurs relations, qui concerne potentiellement l’intégralité du monde paraît extrêmement complexe à réaliser…
comporte plus de 10 000 termes. Un « bon » terme de thésaurus est un terme qui ne génère pas de bruit documentaire. Il doit donc décrire précisément son objet, être non polysémique et de sens constant dans le temps. Par exemple, « organisation » est un terme très générique, inutilisable en tant que requête s’il est employé seul. Un
« bon » terme de thésaurus ne doit pas non plus générer de silence. Un terme trop spécifique aura tendance à créer du silence documentaire. Par exemple, le terme
« galéace » ne sera pas un bon terme pour indexer un document sur « les bateaux à voile et à rame chargés d’artillerie ».
Figure 1. Visualisation hiérarchique du thésaurus
Le thésaurus peut être vu comme un filtre de normalisation de vocabulaire descripteur. D’une part, ces termes descripteurs doivent se faire le reflet de l’évolution des contenus eux-mêmes. Ainsi, l’évolution du langage qui exprime le cours des événements mondiaux ou nationaux, des pratiques sociales, culturelles ou technologiques, constitue-t-elle aussi un élément à prendre en compte. La difficulté de cette tâche est de différencier les évolutions langagières qui constituent des
« effets » de mode de celles qui accompagnent les changements profonds. D’autre part, ces termes descripteurs doivent se faire le reflet de l’évolution des usages.
L’étude des requêtes des utilisateurs permet d’établir l’intérêt de l’introduction de nouveaux types de descripteurs. Par exemple, depuis quelques années, toute scène présentant une anomalie de situation ou de tournage sera indexée de façon à être
facilement repérée pour intégrer un bêtisier. La gestion d’un thésaurus est donc une opération complexe qui suppose une surveillance des termes déjà acceptés, pour les préciser ou éventuellement les supprimer, et des nouveaux termes qui sont soumis, étudiés sur une période donnée, puis rejetés ou intégrés. L’utilisation de ces données lors de l’indexation maintient la cohérence descriptive de l’ensemble des contenus.
Les thésaurus sont structurés en arborescence et peuvent contenir des liens transverses de corrélation sémantique. Les arborescences sont des structures de classification très utilisées et ont fait l’objet de nombreux travaux en visualisation.
De manière générale, le placement d’une arborescence doit obéir aux principales contraintes « esthétiques » suivantes (Battista, 1994) : les nœuds sont placés sur des lignes horizontales ou verticales correspondant à leur profondeur, l’espace entre deux nœuds voisins de même profondeur doit être fixe et minimale, la largeur du dessin doit être aussi petite que possible, les symétries doivent apparaître, et si deux sous-arbres sont identiques, leurs dessins doivent l’être aussi. Une des premières méthodes à satisfaire ces contraintes fut celle de (Reingold, 1981), améliorée par la suite par (Walker, 1990) : l’arbre est déployé horizontalement ou verticalement au choix selon un processus linéaire. Un placement radial a été développé par (Eades, 1992). Les treemaps représentent la hiérarchie par l’inclusion des régions les unes dans les autres. L’algorithme original, slice-and-dice (Johnson, 1991), consiste à séparer l’écran en rectangles dont la surface est significative, en alternant entre découpage horizontal et vertical à mesure que l’on s’enfonce dans la hiérarchie. Il a été amélioré par (Wattenberg, 1998) et (Bruls, 2000).
Outre les contraintes esthétiques données ci-dessus, nos usages imposent les règles suivantes :
– les descripteurs textuels associés aux nœuds doivent être lisibles ;
– l’environnement (ancêtres et frères) du ou des nœuds cible doit être montré ; – le déploiement d’une partie de l’arbre peut s’effectuer manuellement ou par animation dans le cas d’un accès par recherche textuelle directe.
L’importance fonctionnelle du thésaurus nous a conduit à proposer un outil de visualisation interactif présentant deux modes de représentation de l’arborescence.
Un premier mode de visualisation (cf. figure 1) est adapté à une vision de l’arbre dans sa largeur et s’inspire de PAD et PAD++, travaux de K. Perlin (Bederson et al., 1995). Ces travaux s’inspirent du principe d’inclusion développé par les treemaps mais représentent les nœuds par des régions non rectangulaires : l’arborescence apparaît alors comme un ensemble de cercles imbriqués. Chaque cercle représente un nœud de l’arbre et contient à sa périphérie ses nœuds enfants.
Cette technique n’est plus vraiment du space-filling, car l’espace est utilisé moins efficacement qu’avec les treemaps rectangulaires. Par contre l’imbrication imparfaite de cercles dans un cercle rend l’identification des enfants et descendants d’un nœud bien plus facile et permet l’insertion de descripteurs textuels. La navigation s’effectue par une animation continue en cliquant avec la souris sur les cercles apparents ou en cherchant des termes dans le champ de requête.
Un deuxième mode est plus adapté à une vision en profondeur de l’arborescence. Il est basé sur la représentation diagramme nœud-lien de type space tree (Plaisant et al., 2002) qui permet de développer la hiérarchie à la demande en sélectionnant les branches à développer. Les deux représentations sont associées à un moteur de recherche textuelle : l’utilisateur pose une requête, les nœuds cibles sont sélectionnés, marqués et les branches les atteignant sont développées alors que les autres sont masquées.
Ce prototype a été proposé aux documentalistes pour parcourir le thésaurus et/ou vérifier la présence d’un mot, discuté puis mis à leur disposition. Il leur est apparu qu’il pourrait constituer un bon outil pour contrôler l’usage des termes. Un attribut correspondant au nombre de documents indexés par chaque terme a été rajouté aux données et a été associé à un attribut graphique de couleur. Cette représentation permet une analyse très rapide des mots qui peuvent être source de bruit ou de silence. Elle conserve le contexte des termes ce qui permet de visualiser instantanément le voisinage du terme afin d’analyser éventuellement la cause du silence ou du bruit. Par exemple, un mot trop proche sémantiquement dans le voisinage peut influer sur la sous-utilisation d’un terme. Le prototype dispose de filtres permettant d’afficher les nœuds en fonction de paramètres comme leur fréquence d’usage, leur première ou dernière date d’utilisation. Il offre donc des fonctionnalités d’analyse et de contrôle global de l’usage des termes du thésaurus. Il est utilisé pour analyser les pratiques d’indexation et pour effectuer la mise à jour du thésaurus : le prototype de départ a été appréhendé, intégré et détourné par les experts pour un usage particulier. De la même façon, on pourrait appliquer ce prototype à l’analyse des requêtes utilisateurs : l’occurrence des termes constituant les requêtes permettrait de projeter sur le thésaurus une répartition des thématiques demandées par les usagers.
Ce type d’interface est aussi particulièrement adapté pour servir d’accès à des collections structurées en arborescence alors qu’elles présentent une structure de graphe. En effet, il est plus aisé de concevoir des classifications sous forme d’arborescence car l’ajout d’un élément de l’arborescence n’implique pas une mise à jour de la totalité des relations. Cependant, il arrive toujours un moment où on atteint les limites de la classification arborescente et où deux classes distinctes deviennent pertinentes pour référencer un même document, même si la logique de l’auteur en privilégie une. Depuis quelques années, l’INA propose une offre thématisée ou éditorialisée sur ses fonds numérisés. Cette offre regroupe quelques 200 corpus thématiques organisés en arborescence. La possibilité d’effectuer une recherche textuelle sur les descriptions de corpus et de documents permet d’afficher toutes les réponses à une requête dans le contexte de l’arborescence. L’utilisateur peut alors naviguer dans le voisinage de ses résultats. La figure 2 montre la partie de l’arborescence correspondant à la requête « Sartre ». Un document est relatif à la présence de Sartre lors d’une grève des usines Renault. L’utilisateur dispose du voisinage de ce document dans l’arborescence, voisinage qui lui permet tout d’abord de s’informer sur le contenu du document. Le sujet principal de ce
document repose sur les grèves Renault et non sur Sartre, donc sa présence à l’image sera ponctuelle. Ce voisinage lui permet aussi d’appréhender le contexte général de la requête : Renault, le pouvoir syndical et la position de Sartre dans ce conflit social. Cette interface permet à l’utilisateur de comprendre la logique de la classification et d’en tirer partie. Cette interface d’interrogation et de visualisation sera appliquée au parcours de l’offre thématisée du service internet INAMEDIA dans le courant de l’année.
Figure 2. Visualisation sélective d’arborescence de corpus thématiques
5. Requêtes et diagrammes
Le mode de recherche classique5 associé aux bases de données documentaires est la formulation booléenne à partir des termes descripteurs. L’utilisateur dispose d’un formulaire comportant des champs correspondant aux classifications définies par la structuration documentaire (type de programme, droits, matériels…) et un champ sémantique. Il formule une requête en remplissant ces champs par un ou plusieurs termes descripteurs reliés par les opérateurs booléens classiques ET, OU et NON. Si l’expression d’une requête en langage naturel est souvent relativement simple, la formulation booléenne associée peut être complexe.
En effet, la requête booléenne est issue du système documentaire et de la stratégie élaborée pour la recherche. Prenons un exemple de requête réelle simple conduisant à une formulation documentaire non triviale : trouver une séquence de François Mitterrand avec un casque. Une requête du type « Mitterrand » ET
« casque » a peu de chance de retourner des résultats, car le niveau de description en termes de contenu image n’est, en général, pas aussi précis. Aussi, la requête
5. Les méthodes linguistiques pour l’indexation automatique de texte libre (Latent Semantic Analysis, Latent Semantic Indexing) ont pris un véritable essor avec le développement de l’internet. Si cette approche ne permet pas d’assurer une minimisation du silence et du bruit au niveau de l’indexation documentaire, elle s’avère extrêmement intéressante au niveau de la recherche, particulièrement lorsqu’elle est utilisée en corrélation avec la structuration documentaire. Elle constitue alors un élément intégrable dans une requête booléenne type.
booléenne correspondante ressemblera-t-elle sans doute plus à l’expression suivante : Mitterrand ET (visite ET (chantier) ET (NON (discours OU interview OU débat))). La stratégie consiste ici à enlever tous les documents dont la forme ne permet pas d’imaginer le port d’un casque et qui constituent la plus grande partie des documents sur Mitterrand, puis à supposer qu’une telle séquence a de fortes chances de se trouver lors d’une visite de chantier. Une étude des requêtes effectuées par les documentalistes de l’INA montre qu’une formulation booléenne est très rarement composée de plus de 5 termes. Les documentalistes préfèrent utiliser un mode d’interrogation itératif. La requête précédente s’effectuera alors en deux temps : (Mitterrand ET visite ET chantier) puis l’ensemble R des résultats étant trop vaste, la requête (R ET (NON (discours OU interview OU débat))) permettra de réduire l’ensemble des résultats à visualiser. Cependant, même sur un nombre restreint d’éléments, l’ordre des termes et des parenthèses rend la formulation booléenne délicate à manipuler. L’utilisation de représentations ensemblistes interactives permet aux utilisateurs d’effectuer ces opérations de manière visuelle.
Deux types de diagrammes génèrent des représentations ensemblistes: les diagrammes de Venn (http://theory.cs.uvic.ca/~cos/venn/VennEJC.html) et les diagrammes d’Euler. Les diagrammes de Venn/Euler sont des représentations basées sur l’analogie entre un ensemble et une région du plan. L’intérieur de la région symbolise l’ensemble, l’extérieur le reste de l’univers et l’intersection géométrique reflète l’intersection ensembliste. Les deux propriétés essentielles des diagrammes de Venn et d’Euler sont les suivantes : chaque région d’intersection est représentée de manière unique et chaque ensemble est connexe, c’est à dire représenté par une portion de plan unique. Un n-diagramme de Venn comprend les 2n régions représentant toutes les intersections potentielles d’une collection de n ensembles. Un diagramme d’Euler ne représente qu’un sous ensemble de ces régions. Le diagramme de Venn à 3 ensembles est une figure très couramment utilisée pour expliciter la notion d’ensembles (cf. figure 3). Il existe plusieurs représentations de ces diagrammes, dont celles de Venn (Venn 1880) et d’ Edwards (Edwards, 2004), basées sur deux techniques distinctes de construction incrémentale. Le type de représentation et le nombre d’ensembles influent sur la lisibilité des diagrammes. Un diagramme à n ensembles, contenant 2n régions, devient vite inutilisable lorsque l’on augmente le nombre d’ensembles. Néanmoins, il existe des représentations possédant des propriétés de lisibilité intéressantes au niveau applicatif jusqu’à 5 ensembles. Les ensembles se présentent sous la forme de cercles ou d’ellipses, dont les contours se coupent deux à deux (cf. figure 4). Ces formes, dont le tracé est continu au sens mathématique, sont facilement reconnaissables et identifiables. Une région peut alors être perçue relativement aisément comme l’intersection d’une partie de ces ensembles. Leurs symétries réduisent l’effort cognitif pour l’interprétation, tout particulièrement pour les 1,3 et 5-diagrammes qui présentent une symétrie centrale. Enfin, ces diagrammes présentent une cohérence dans la représentation des ensembles car dans chaque
diagramme les mêmes contours sont utilisés, seules changent leur position et leur orientation.
Figure 3. Cartographie sous forme de diagramme de Venn à 3 ensembles
Notre premier prototype de visualisation ensembliste est composé de 3 zones (cf. figure 3) : une zone de formulation de la requête dans laquelle 5 champs de saisie sont proposés à l’utilisateur, une zone d’affichage du diagramme de Venn, et enfin une zone d’affichage des documents résultants. La validation des champs de saisie déclenche une séquence de requêtes dans la base de données associée afin de générer le diagramme de Venn correspondant. Le nombre de documents résultats apparaît dans chaque région et peut être associé à l’intensité de couleur de la région.
L’utilisateur peut sélectionner une ou plusieurs régions du diagramme, soit pour visualiser la liste des documents qu’elles contiennent, soit pour générer le nouvel ensemble de départ d’une requête itérative. En effet, dans le cas où le nombre de documents sélectionnés est trop important pour être visualisé, l’utilisateur peut réduire l’ensemble sur lequel effectuer une nouvelle requête en utilisant sa sélection comme nouvelle base de recherche. Une formulation booléenne relative à l’ensemble des régions sélectionnées est proposée à l’utilisateur pour permettre éventuellement une vérification sémantique. Cette formulation correspond à la forme conjonctive la plus simple : elle minimise le nombre d’opérateurs (McGeer et
al., 1993). Pour amplifier la lisibilité du diagramme, une animation sous forme d’un clignotement continu de deux cycles est associée aux ensembles constituant la région sur laquelle est positionnée la souris. Ce type d’interaction utilisant une variable temporelle permet d’amplifier la lisibilité du diagramme sans le surcharger (Saulnier, 2005). Dans le cas d’une requête exploitant une recherche full text, on peut associer un score de pertinence aux documents d’une zone. Ce score compte le nombre d’occurrences du terme dans le texte. Un filtrage sur ce score permet d’ajuster le nombre de documents dans chaque région. Nous ferons remarquer ici que le score de pertinence peut être différent de la pertinence du document du point de vue de l’utilisateur.
Cette cartographie des résultats de requête possède une propriété intéressante : un document ne peut appartenir qu’à une seule zone du diagramme. Par conséquent lors d’une exploration des résultats dans l’ordre des zones les plus pertinentes, on ne consultera jamais deux fois un document. Par ailleurs, cette représentation permet à l’utilisateur de valider, instantanément et pour chaque champ, la pertinence des termes de la requête. Lorsqu’on utilise un langage normalisé comme le langage documentaire, cette fonctionnalité est particulièrement intéressante puisqu’elle permet de détecter instantanément qu’un terme n’appartient pas au langage.
L’affichage du nombre de documents dans chaque zone donne la représentativité de chaque terme. En cas de région cible vide, une stratégie d’exploration des zones proches peut être envisagée. Enfin, ce type de représentation propose à l’utilisateur une cartographie locale de la base consultée centrée sur son objet: elle lui permet de valider la pertinence de son contexte de recherche. Si l’utilisation de mots-clés partitionne et réduit la description du document en supprimant les relations entre termes, elle permet aussi une recherche sur des associations plus vastes car non formulées au cours de l’indexation. Ce type de cartographie révèle les associations formalisées au niveau de la requête par rapport à l’ensemble de la base de documents.
Dans le cas des bases documentaires, qui disposent d’un certain nombre de classifications exclusives, les diagrammes de Venn présentent souvent des régions vides. Il est alors intéressant d’éliminer ces parties vides afin de simplifier le diagramme et d’accroître ainsi sa lisibilité. Le diagramme de Venn se transforme alors en diagramme d’Euler. L’existence d’un diagramme d’Euler qui représente les intersections d’une collection de n ensembles dépend du nombre n et des contraintes de dessin imposées sur les contours et leurs intersections. Par exemple, avec des contraintes de points d’intersection simples6 et des contours convexes, le diagramme d’Euler issu du 4-diagramme de Venn sans la région centrale n’est pas dessinable. A 9 ensembles, on trouve le premier cas de collection d’intersections pour laquelle il n’existe pas de diagramme d’Euler associé, quelles que soient les contraintes de dessinabilité des contours.
6. Un point d’intersection simple est l’intersection d’exactement deux contours.
Figure 4. Cartographie sous forme de diagramme de Venn à 4 ensembles
Figure 5. Cartographie sous forme de diagramme d’Euler à 4 ensembles
Dernièrement, nous avons montré qu’en permettant des points d’intersection multiples et des morceaux de contours communs, toute collection d’intersections faisant intervenir jusqu’à 8 ensembles pouvait être représentée par un diagramme d’Euler (Verroust et al., 2004). La démonstration est constructive et permet de générer un ou une série de diagrammes solution pour une collection d’intersections donnée. Les figures 4 et 5 représentent les diagrammes de Venn et d’Euler correspondant à une même requête. Sur le diagramme d’Euler, les contours des ensembles sont décalés pour les rendre perceptibles, ensemble par ensemble (Thièvre et al., 2005). Ce prototype est en cours de finition et sera très prochainement mis en test. Lors de la présentation du prototype, les utilisateurs ont d’ores et déjà émis des demandes d’aires proportionnelles au nombre de documents contenus dans chaque région afin de permettre une analyse quantitative instantanée des résultats.
6. Cartographies de corpus sous forme de graphes
Les graphes sont des structures de réseaux qui contiennent deux types d’éléments : des entités, appelés nœuds, et des relations entre ces entités appelées arêtes. Les réseaux routiers, aériens ou ferroviaires sont naturellement modélisés par des graphes dont les nœuds correspondent aux lieux et les arêtes aux liaisons de transport. Les graphes constituent de manière générale une bonne modélisation des réseaux d’échange et de communication. Mais la réalité offre de nombreux exemples de réseaux « cachés » dont la modélisation sous forme de graphe permet l’analyse en termes d’organisation globale ou locale.
Disposant de la collection complète des journaux télévisés des chaînes publiques et des chaînes privées jusqu’en 1993, l’INA se trouve dans une position privilégiée pour établir une cartographie de l’information télévisuelle. En effet, chaque sujet de journal télévisé fait l’objet d’une indexation documentaire composée d’un résume synthétique, d’une description par mots-clés ou grille sémantique, et d’une description générique. La description par mots-clés constitue, à plusieurs titres, une excellente base pour la réalisation d’une cartographie de l’information. En effet, la fonction essentielle du langage documentaire qui permet la désambiguïsation du langage naturel assure que deux sujets sémantiquement distincts ne seront pas corrélés par la polysémie d’un terme. D’autre part, l’utilisation de grilles sémantiques et de termes choisis pour la description d’événements type génère des groupes redondants de codescripteurs, le plus souvent distincts les uns des autres.
Dans une modélisation sous forme de graphe, la codescription génère des agrégats de type « petit monde ». De plus, les descripteurs ont un degré de généricité variable et peuvent donc avoir un nombre de codescripteurs très différent. Par exemple, un sujet sur le naufrage de l’Erika en 2000 sera décrit par : catastrophe, pollution, naufrage, Bretagne, pétrole, plages. Catastrophe est un terme très générique qui est associé à plus d’une trentaine d’événements et à plus de 130 descripteurs, alors que plage est relié uniquement à 6 autres descripteurs. De par ces
caractéristiques, il semble intéressant de modéliser la carte de l’information par un graphe dont les entités représentent les termes descripteurs, et les arêtes la relation
« décrit un même sujet de journal télévisé». En effet, ces données présentent des caractéristiques structurelles de graphe « sans échelle », combinées avec des parties
« petit monde ».
L’utilisateur définit dans un premier temps le corpus qu’il désire étudier en définissant par exemple la chaîne et la période de temps. Il dispose d’une vue graphique et d’une vue des données sous forme de tables contenant deux types de paramètres : les attributs intrinsèques aux données et les attributs liés à la topologie du graphe. Les attributs intrinsèques aux données sont par exemple, le nombre ou la durée cumulée des sujets indexés par un descripteur ou une arête. Ils associent un degré d’importance sémantique aux entités indépendamment de leur environnement dans le graphe. Les attributs liés à la topologie du graphe sont, par exemple, le degré, l’indice de centralité ou de clustering d’un nœud. Leur manipulation permet de faire émerger des données, s’ils existent, des « clusters », groupes d’éléments plus fortement reliés entre eux qu’au reste du graphe (Boutin et al., 2006) ou des nœuds présentant un fort degré de connectivité. Ils sont calculés uniquement avec les informations nœuds/arêtes sur une portion ou la totalité du graphe.
L’étude des graphes constitue un domaine vaste de recherche. Les travaux sur la théorie des graphes aléatoires ont été initiés par Erdõs et Rényi (Erdos et al., 1959), à partir desquels (Bollobas, 1985) a observé l’émergence de propriétés d’agrégation en fonction de leur densité. Même si les graphes construits à partir de données réelles ne se comportent pas comme des graphes aléatoires (Barabasi, 1999), leur distribution des degrés suivant plutôt une loi de puissance, ces derniers sont intéressants à utiliser comme objet de comparaison avec des données réelles. Les travaux relatifs au placement des nœuds sont nombreux (Herman, 2000).
L’approche la plus courante est la simulation de systèmes physiques de type masse/ressort (Eades, 1984). Ces travaux ont fait l’objet de nombreuses adaptations (Kamada 1989 ; Davidson 1989 ; Fruchterman, 1991) dont la dernière (Noak, 2004) est extrêmement performante pour faire émerger les agrégats.
Le positionnement du graphe est réalisé dans un premier temps à partir d’algorithmes standard de placement issus de la librairie PREFUSE (Herr, 2005).
Nous avons développé les algorithmes de simulation de systèmes de forces de type
« masse/ressort » cités précédemment. Malheureusement, il existe très peu de graphes issus de données réelles dont le placement par ces techniques soit directement exploitable en terme visuel (Herman et al., 2000). De manière générale, ces graphes sont denses (10 000 nœuds, 400 000 arêtes), ils contiennent beaucoup de nœuds ou d’arêtes d’occurrence et d’ordre faibles (1 ou 2). Un des principaux aspects de cette recherche est donc de concevoir des outils de filtrage : il s’agit alors d’éliminer certains nœuds ou arêtes bien choisis afin de faire émerger les structures intéressantes du graphe. Comme il a été mentionné précédemment, les tables d’attributs disposent de fonctionnalités de tri multiple. L’utilisateur peut trier aisément selon un ou plusieurs attributs et sélectionner un sous ensemble d’entités
du graphe, nœuds ou arêtes, par rapport à un seuil ou une valeur. Il peut établir ainsi une suite de filtres topologiques et sémantiques de manière à faire émerger l’information signifiante.
Ainsi, pour obtenir la figure 6, nous avons sélectionné le corpus des journaux télévisés de la chaîne Arte pour l’année 2000. Nous avons généré le graphe des descripteurs sur l’ensemble du corpus, qui apparaît le plus souvent comme un agrégat dense de points et d’arêtes, inexploitable visuellement. Tout d’abord nous avons éliminé les descripteurs d’occurrence faible qui représentent des sujets d’actualité peu traités, puis les arêtes d’occurrence faible afin de ne garder que les liaisons les plus significatives des amas.
Nous avons permis l’étalement du graphe et l’émergence de regroupements de termes signifiants en éliminant temporairement certaines arêtes isolées reliant deux groupes denses (Boutin et al., 2006). Dans certains cas, le filtrage de quelques nœuds de degré très élevé peut s’avérer extrêmement efficace pour améliorer la carte. En effet, ces nœuds perturbent la mise à plat du graphe en rassemblant, au centre du graphe, des groupes potentiellement distincts. Dans le cas où les entités représentent des termes, il s’agit le plus souvent de termes « outils » multifacette comme « manifestation ». Les liens et les descripteurs filtrés peuvent être réintégrés à la visualisation dès qu’un placement satisfaisant est réalisé.
Chaque attribut peut être associé interactivement à un attribut graphique afin de mettre en évidence visuellement les groupes ou l’importance d’un terme ou d’une liaison. Ainsi sur la figure 6 un dégradé de couleur (rouge-vert) est associé à la
« durée d’usage cumulée » du nœud sur l’année, marquant en rouge les termes correspondant aux durées de traitement les plus élevées sur l’année. La taille est associée à l’occurrence du terme, introduisant ainsi une échelle de visibilité des entités en fonction de leur fréquence d’utilisation. Cet effet, cumulé à l’association d’un dégradé de couleur à l’occurrence des arêtes, amplifie la perception des groupes de termes significatifs.
L’utilisateur dispose de deux types de vues : une vue globale et une vue locale.
La vue globale (cf. figure 6) permet d’analyser les groupes qui émergent des données. La vue locale (cf. figure 7) représente l’environnent d’un nœud sélectionné et peut être paramétrée en termes de nombre et de caractéristiques de nœuds visibles. Le passage entre deux vues locales est interactif par sélection du nœud cible.
Une remarque pour commencer une analyse très succincte des résultats : les descripteurs les plus fréquemment utilisés pour l’année 2000 sur ARTE sont attentat, île, gouvernement, prise d’otage et violence. La figure fait apparaître instantanément plusieurs types d’information : les descripteurs importants en termes de durée globale des sujets qu’ils indexent, en termes d’occurrence, les associations de termes, et les groupes de descripteurs plus reliés entre eux qu’avec le reste du graphe.
Figure 6. Graphe global du corpus des JT d’Arte sur l’année 2000 avec zoom sur les deux agrégats les plus importants
Figure 7. Graphe local du corpus des JT d’Arte sur l’année 2000 autour du terme
« victime »
Les descripteurs fréquemment utilisés correspondent soit à un événement unique mais très relayé par les journaux télévisés, comme la tempête ou la prise d’otages aux Philippines pour l’année 2000, soit à des événements types récurrents, comme par exemple le descripteur faits divers, ou encore à des grand thèmes d’information comme l’illustre le terme santé. Le nombre de relations qu’un descripteur entretient avec le reste du graphe informe sur le traitement informationnel dont il fait l’objet.
De manière générale, l’analyse des relations entre descripteurs fait apparaître deux types d’agrégats : des petits groupes de termes et de liens présentant une forte occurrence (agrégats rouges sur la figure) et des regroupements plus vastes caractérisés par une connectivité relativement dense mais d’importance informationnelle plus faible (agrégats verts). D’un point de vue global, naufrage se
trouve intégré dans un agrégat rouge composé de sous-marin, et mer, lui même inclus dans un agrégat vert de descripteurs liés à l’environnement et au milieu marin. Très rapidement, l’analyse des agrégats rouges fait émerger les groupes suivantes : « naufrage/océan/pollution/sous-marin », « île/prise d’otage/islam »7,
« scandales politiques/financiers/corruption/témoignage ». Deux arêtes correspondent à des cooccurrences très fortes donc à des sujets d’actualité très souvent abordés : « carburant/politique économique », « gouvernement/violence »8. La vue locale permet d’étudier dans le détail le contexte d’un terme. La connectivité élevée du descripteur spécifique victime, par exemple, donne un aperçu des facettes principales de son utilisation. Les deux agrégats principaux s’articulent autour de catastrophes naturelles (inondation, aide humanitaire, environnement santé) et attentats (guerre civil, terrorisme, conflit…). On retrouve l’événement très médiatisé des journalistes pris en otage aux Philippines dans le lien rouge « île-islam » ainsi que le lien « gouvernement-violence ». Les aspects sociétaux procès indemnisation sont aussi présents. Ces premiers résultats ne constituent que l’ébauche de la démarche d’analyse. En effet, ces cartes ne pourront être interprétées qu’en regard des événements ou groupes d’événements auxquels elles se rapportent. Cet aspect très intéressant ne constitue pas le sujet de cet article, aussi nous arrêterons nous à ce niveau quant à l’analyse de cette figure. En résumé, ces cartographies de l’information permettent d’obtenir très rapidement des vues globale et locales de sujets d’actualités traités en intégrant des données quantitatives et qualitatives. Elles font émerger automatiquement les thèmes les plus traités de l’information et leur contexte. Elles peuvent être utilisées comme point d’entrée pour naviguer, effectuer des analyses sur les média, faire des comparaisons entre chaînes ou périodes de temps, assurer l’exhaustivité du traitement d’un sujet. L’INA a développé, sous le nom de baromètre thématique, une méthode de classification automatique de tous les sujets de JT en 14 catégories afin de proposer une ébauche d’analyse globale du traitement de l’actualité sur les chaînes TV. Cet outil constitue une approche complémentaire pour l’analyse des média télévisuels.
Ce prototype est générique et permet de traiter sous forme de graphe n’importe quelle donnée exprimée en format graphML. Il permet donc de visualiser aussi les réseaux sociaux du monde télévisuel par exemple, ou des portions du réseau internet. L’INA développe depuis avril 2006 une offre grand public en ligne. Dans ce cadre, plusieurs modes de navigation sont disponibles, permettant à l’utilisateur de naviguer par thème, par personnalité, par événement… et par proximité. Pour chaque document sélectionné, l’utilisateur dispose de la liste de ses descripteurs. Il peut alors naviguer de proche en proche sémantique en sélectionnant dans cette liste, les mots relatifs aux sujets qui l’intéressent. Une représentation sous forme de graphe local de cette liste permettra prochainement de naviguer de proche en proche
7. Touristes et journalistes pris en otage aux Philippines, juillet/septembre 2000.
8. L’étude des sujets (ARTE année 2000) comportant l’association violence-gouvernement montre que cette association est presque exclusivement utilisée pour décrire le conflit israélo- palestinien, et constitue donc un bon indice pour mesurer son importance médiatique.
en disposant d’informations complètes sur les corrélations et le voisinage de ces descripteurs. Si les résultats sont d’ores et déjà encourageants pour les vues globales, certains aspects nécessitent néanmoins des améliorations importantes, comme la prise en compte d’échelles au niveau visualisation et mise à plat du graphe, ainsi que des modes de filtrages plus élaborés, ou encore la génération automatique de suites de filtres adaptées aux données.
7. Conclusion
La mutation numérique place les bibliothèques numériques face à un paradoxe.
D’une part l’intégration des ressources au sein d’un même système entraîne une simplification des tâches d’archivage, de gestion et d’accès matériel. D’autre part, l’augmentation du volume des ressources et de leurs descriptions potentielles implique une complexification de l’organisation des contenus et de leur accès sémantique. Les outils décrits dans cet article constituent une première approche pour offrir à l’utilisateur une interface d’accès conviviale. Ils peuvent être combinés pour effectuer graphiquement des tâches complexes : la sélection de corpus s’effectue à l’aide des deux premiers outils, de type arborescence et diagramme, et le troisième, de type graphe, en donne une visualisation globale ou locale des données. De plus, ces outils permettent à l’utilisateur d’enrichir sa compréhension du système documentaire afin d’en exploiter les richesses et les subtilités au cours de ses recherches. De telles approches participent à la garantie de qualité d’accès et de fiabilité d’usage demandées aux bibliothèques. Non seulement les cartographies sont très performantes pour analyser les données et leur contexte mais, elles constituent de plus une excellente base pour la navigation par proximité, fonction essentielle d’une bibliothèque, si l’on en croit Umberto Eco…
« La notion de bibliothèque est fondée sur un malentendu, à savoir qu’on irait à la bibliothèque pour chercher un livre dont on connaît le titre. C’est vrai que cela arrive souvent mais la fonction essentielle de la bibliothèque, de la mienne et de celle des amis à qui je rends visite, c’est de découvrir des livres dont on ne soupçonnait pas l’existence et dont on découvre qu’ils ont pour nous la plus grande importance… La fonction idéale d’une bibliothèque est donc un peu semblable à celle du bouquiniste, chez qui on fait des trouvailles et seul le libre accès aux rayons le permet. »
Par ailleurs, un des enjeux actuels des bibliothèques multimodales numériques comme l’INA est d’inventer d’autres modes d’accès aux ressources. Les progrès réalisés en traitement d’images et de sons permettent d’envisager l’accès par le contenu du média dans un futur raisonnable. L’exploitation de ces nouveaux critères et leur combinaison proposera aux utilisateurs des modes de navigation transverse, par similarité ou proximité de contenus son ou image. Ces nouveaux types de corrélation de documents constitueront autant de liens à analyser, superviser ou contrôler afin d’établir des vues globales des ressources.
La bibliothèque numérique se trouve au centre d’un système en pleine évolution.
Elle est ainsi dans une position idéale pour fournir des outils d’observations des flux et les tendances liées à ses données, aussi bien en termes sociaux ou culturels, qu’en termes d’usages. La mutation vers le numérique rend plus aisée la réalisation d’outils d’analyse globale et locale des contenus, des flux et des usages. Cet aspect, dans lequel la visualisation d’information a un rôle fondamental à jouer, constituera vraisemblablement un des futurs rôles importants des bibliothèques numériques.
8. Bibliographie
Anthony W. F. Edwards and J. H. Edwards, “Metrical Venn diagrams”, Annals of Human Genetics 56, 71-75. 1992, Also reprinted in Cogwheels of the Mind.
Barabasi A., Albert R., Jeong H., “Scale-free characteristics of random networks: The topology of the world wide web”, Physica A, 281:69-77, 2000.
Battista G., Eades P., Tamassia R., Tollis I.G., “Algorithms for drawing graphs: An annotated bibliography”, Computational Geometry: Theory and Applications, 4 (5). 235-282, 1994.
Bederson B., Hollan J., Perlin K., Meyer. J., Bacon D., Furnas G., "Pad++: A Zoomable Graphical Sketchpad for Exploring Alternate Interface Physics", Journal of Visual Languages and Computing, 7, pp. 3-31, 1996.
Bertin J., La sémiologie graphique, Editions Mouton, Gauthier-Villars, Paris, 1967.
Bertini E., Catarci T., Di Bello L., Kimani S., "Visualization in Digital Libraries", Integrated Publication and Information Systems to Virtual Information and Knowledge Environments, M. Hemmje, C. Niederee and T. Risse Ed.s, Springer-Verlag Berlin, 2005.
Bollobas B., Random graph, Academic Press, London, England, 1985.
Boutin F., Thièvre J., Hascouët M., “Focus-based Filtering + clustering technique for power law network with small world phenomenon”, Visualization and Data Analysis 2006, San Jose, USA, 2006.
Bruls M., Huizing K., vanWijk J.J., "Squarifed treemaps", in Proceedings of the Joint Eurographics and IEEE TCVG Symposium on Visualization, IEEE Computer Society, pp. 3-42, 2000.
Davidson R., Harel D., "Drawing graphs nicely using simulated annealing", Technical Report CS89-13, Department of Applied Mathematics and Computer Science, The Weizmann.
Eades P., "A Heuristic for Graph Drawing", Congressus Numerantium 42, pp. 149-160, 1984.
Eades P., "Drawing Free Trees", Bulletin of the Institute of Combinatorics and its Applications, pp. 10-36, 1992.
Edwards A. W. F., Cogwheels of the Mind: The Story of Venn Diagrams, The John Hopkins University Press, Baltimore, Maryland, 2004.
Erdos P., Renyi A., “On random graphs”, Publ. Math. Debrecen, 6:290-297, 1959.
Everingham M., Zisserman, A., “Identifying individuals in video by combining generative and discriminative head models”, Proceedings of the International Conference on Computer Vision (2005) Institute, Rehovot, Israel, 1989.
Fruchterman T. M. J., Reingold E. M., "Graph drawing by force-directed placement", Software: Practice and Experience, 21(11), pp. 1129-1164, 1991.
Gershon N., Eick S., "Foreword," Proc. IEEE Symp. Information Visualization, InfoVis 95, IEEE CS Press, 1995.
Gibson J.J., “The theory of affordances”, Perceiving, Acting and Knowing, Hillsdale, NJ:
Erlbaum, R. Shaw & J. Bransford (eds.), 1977.
Heer J., Card S., Landay J, “Interactive information visualization: prefuse: a toolkit for interactive information visualization”, Proceedings of the SIGCHI conference on Human factors in computing systems, ACM Press, April 2005.
Herman G., Melancon G., and Marshall M. S., “Graph visualization and navigation in information visualization: A survey”, IEEE Transactions on Visualization and Computer Graphics, 6(1):24-43, 2000.
Joly A., Buisson O., Frélicot C., “Statistical similarity search applied to content-based video copy detection”, In 1st IEEE Int. Work. on Managing Data for Emerging Multimedia Applications, Tokyo, Japan, pp. 593-596, April 2005, EMMA’05.
Kamada T., Kawai S., "An Algorithm for Drawing General Undirected Graphs", Information Processing Letters 31, pp. 7-15, 1989.
Larkin J., Simon H.A., “Why a Diagram is (Sometimes) Worth 10000 Words’’, Cognitive Science, 11:65-99, 1987.
McGeer P., Sanghavi J., Bravton R., Sangiovanni Vincentelli A., “Espresso-signature: a new exact minimizer for logic functions Full text”, Annual ACM IEEE Design Automation Conference, Proceedings of the 30th international conference on Design automation, Dallas, Texas, United States, pp. 618-624, 1993
Noack A., "An energy model for visual graph clustering", G. Liotta, editor, Proceedings of the 11th International Symposium on Graph Drawing (GD 2003), LNCS 2912, pp. 425-436, Springer-Verlag, Berlin, 2004.
Plaisant, C., Grosjean J., Bederson B., “SpaceTree: Supporting Exploration in Large Node Link Tree, Design Evolution and Empirical Evaluation”, Proceedings of the IEEE Symposium on Information Visualization (InfoVis’02), p. 57, 2002.
Reingold E.M., Tilford J.S., “Tidier drawings of trees”, IEEE Transactions on Software Engineering, 7(2):223-228, 1981.
Saulnier A., « La perception du mouvement dans les systèmes de visualisation d’informations », IHM, Toulouse, 2005
Thièvre J., Viaud M.L., Verroust-Blondet A., “Drawing diagrams from labelled graphs”, Euler Diagram 05 INA, Paris, 2005.
Tufte E.R., The Visual Display of Quantitative Information, Hardcover, Graphics Press, 1992.
Venn J., “On the diagrammatic and mechanical representation of propositions and reasonings”, The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science, 9, 1880, 1-18.
Verroust A., Viaud M.L., “Ensuring the drawability of extended Euler diagrams for up to 8 sets”, Diagrams 2004, pp. 128-141, Cambridge, 2004.
Walker J. Q., "A node-positioning algorithm for general trees", Software, Practice and Experience, 20(7), pp. 685-705, 1990.
Ware C., Information Visualization: Perception for Design, Morgan Kaufmann, San Francisco, 2004.
Wattenberg, M. “Map of the Market” (1998). http://www.smartmoney.com/marketmap