• Aucun résultat trouvé

2.2 La visualisation d’information

2.2.1 Les fondements théoriques de la visualisation d’information

Les fondements de la visualisation de l’information sont issus des recherches en sciences cognitives, en science de la perception, en sciences informatiques et de l’interaction homme- machine. Celles-ci, menées pour la grande majorité entre 1989 et 1998 sont regroupées et condensées dans les « Readings in Information Visualization », éditées en 1999 par Card, Mackinlay et Shneiderman. Parallèlement, durant cette même décennie, en sciences humaines appliquées comme les sciences de l’information ou la psychologie cognitive, on assiste à un changement de paradigme majeur qui amène à reconsidérer les approches centrées sur le système à des approches dites « centrées utilisateur », « cognitive » ou encore « sociocognitive ». Ce changement majeur s’est effectué sur plusieurs années et s’est répandu à travers les différentes branches scientifiques parfois au niveau théorique, parfois au niveau de l’application et parfois au niveau de la méthodologie d’évaluation. Toutefois, ce n’est qu’au début des années 2000, que la convergence autour d’une approche cognitive et holistique entre les sciences se constate à travers :

• l’approche cognitive, voire sociocognitive, globale de la recherche d’information (Vakkari 2003; Ingwersen et Järvelin 2005)

• l’approche de l’interaction homme-machine sur les systèmes de recherche d’information centrée sur l’utilisateur Marchionini (2006b)

• le cadre sociocognitif pour évaluer les systèmes de recherche d’information formulé par Borlund (2003)

En 1999, en ce qui a trait à la visualisation des résultats de recherche, seule l’application aux systèmes de repérage d’information et donc aux techniques informatiques et algorithmiques

des interfaces de visualisation, une première évaluation d’utilisabilité mais uniquement des algorithmes d’affichage a été effectuée. L’évaluation de l’utilisabilité de la visualisation d’information n’en était qu’à ces débuts. Dès lors, à l’aube des années 2000, la visualisation des résultats de recherche est résolument ancrée dans le paradigme centré sur le système et théoriquement fondé sur les fondements associés à la visualisation d’information abstraite, en général. On distingue l’information abstraite de l’information concrète, dans la mesure où l’information ne fait pas référence à une réalité aisément représentable comme par exemple, des informations sur la températures d’un moteur, si nous reprenons l’exemple donné par Tufte qui analyse la mauvaise conception de la représentation graphique de cette information et qui a conduit à une mauvaise prise de décision résultant dans l’explosion de la fusée Challenger en 1985.

2.2.1.1 Considérations épistémologiques sur la visualisation d’information

Le fait de représenter l’information sous une forme graphique externe n’est pas nouveau. Pour cela on utilise des signes, des symboles, des images « réalistes » ou symboliques. La visualisation, étymologiquement, relevait de la faculté psychologique de « se représenter mentalement une image visuelle qui n’est pas présente » (Trésor de la Langue Française 1887, entrée « visualisation »; Oxford English Dictionary 2009, entrée « visualization »).La visualisation permet d’externaliser une image mentale sous la forme d’un phénomène objectivé, appréhendable par les sens, représenté. À cet égard, l’« action de rendre visible un phénomène qui ne l’est pas » (Trésor de la langue française 1887, entrée « visualisation »), le sens commun admis au terme de « visualisation » s’accorde en partie à la conceptualisation scientifique qui considère la visualisation comme « an external artifact supporting decision making » (Ware 2000, 1) ou plus précisément comme des « mechanisms in humans and computers which allow them in concert to perceive, interpret, use and communicate visual information » (McCormick, DeFanti, et Brown 1987, 3).

De plus, le passage du concept de « donnée » au concept d’« information » participe de ce phénomène de « représentation ». Dérivé du terme latin « informatio », le substantif désignait déjà l’idée de « mise en forme par les mots ». Le premier sens référait au dessin, à l’esquisse. Le second sens conférait à l’information, la signification d’« idée », de « conception », de « représent [er] une idée par les mots » (Gaffiot, entrée « informatio »). Par conséquent, ce qui constitue la visualisation d’information relève de la représentation qui prête un référent graphique concret à la

structure sémantique de l’information, directement perceptible par la vision. Ce procédé a été utilisé dans de nombreux contextes et s’est développé en fonction de la nature des données et de la finalité de la représentation. Avec la masse pléthorique d’information sur le Web et la domination de l’écran comme terminal de communication d’information, la visualisation s’arrime aux potentialités technologiques de l’informatique en matière de structuration et d’affichage (McCormick, DeFanti et Brown 1987, 3; Card, Mackinlay et Shneiderman 1999, 7). Ce procédé suscite un intérêt renouvelé et se redéfinit en tant que dispositif technologique au contact des diverses disciplines scientifiques qui le constituent : les sciences cognitives, la psychologie de la perception, les sciences informatiques, l’interaction homme-machine, le design graphique et le domaine de l’analyse visuelle, les sciences de l’information.

Le terme de « visualisation d’information » ou « information visualization » tel que nous le concevons dans cette recherche est apparu en 1989 dans l’article de Robertson, Card et Mackinlay, intitulé « The Cognitive Coprocessor Architecture for Interactive User Interfaces ». Dans cet article, la visualisation d’information est appréhendée comme une nouvelle architecture d’interface utilisateur. Elle est sensée résoudre la double problématique introduite par :

• d’un côté la tolérance au caractère asynchrone des interactions entre les différents agents en présence (l’utilisateur, le discours de la machine, et la tâche logicielle bas-niveau de l’application), lesquels peuvent vouloir s’interrompre les uns les autres.

• et de l’autre, par le fait de conserver le caractère animé des objets d’interaction qui, à l’image de l’huile dans les rouages d’une mécanique, permet de passer d’un état à un autre de manière fluide, réduisant de facto la charge mentale générée par l’effort de reconstruction mentale des relations entre le premier état de l’interface et le second. Considérant ce problème central à l’interaction homme-machine, les auteurs font appel pour leur « Cognitive Coprocessor » à un dispositif pionnier de visualisation d’information qu’ils décrivent de la manière suivante :

In information visualization, 2D and 3D animated objects (or visualizations) are used to represent both information and the structural relationships of information. (Robertson, Card, et Mackinlay 1989, 12)

Cette première expérience de visualisation d’information s’en est suivie de nombreuses autres, nécessitant aussi d’asseoir théoriquement la visualisation d’information.

L’objectif de cette section est de présenter les fondements théoriques de la visualisation et les discussions qui résultent de son application générale à la représentation de l’information

abstraite, comme les résultats de recherche. Pour ce faire, nous examinons le sujet dans toute son interdisciplinarité : sciences cognitives, psychologie, neurosciences, art graphique, linguistique, interaction homme-machine, sciences de l’information.

Nous proposons en premier lieu de définir la visualisation d’information et d’en extraire les éléments pertinents au regard du contexte de la recherche d’information, afin d’introduire le modèle de référence de la visualisation d’information. En second lieu, les propriétés et principes techniques, graphiques, interactifs et cognitifs de la visualisation sont décrits et analysés.

2.2.1.2 Définition

2.2.1.2.1 Le concept de visualisation d’information

Information visualization: the use of computer-supported, interactive, visual representations of abstract data to amplify cognition. » (Card, Mackinlay, et Shneiderman 1999, 7)

Établie à partir des recherches sur la visualisation de données abstraites durant les 10 années précédentes, cette définition s’appuie aussi sur des théories connexes et récentes telles que celle de la cognition (Norman 1983; Larkin et Simon 1987; Resnikoff 1989; Hutchins 1996) et moins récentes telles que celle de la sémiologie graphique (Bertin 2005) et de la théorie des formes (Koffka 1935). L’idée sous-jacente est que la visualisation s’appuie sur notre perception visuelle (Ware 2000) afin de faciliter le traitement de l’information et d’alléger la mémoire de travail (Robertson, Card et Mackinlay 1989, 10; Shneiderman 1996).

La grande majorité des membres de la communauté scientifique adopte encore cette première définition sans réserve. Depuis 1999, d’autres définitions ou principes constitutifs de la visualisation d’information ont été proposés, que l’on peut considérer pour la plupart comme des variations de la définition de Card, Mackinlay et Shneiderman. La complémentarité de la représentation graphique et interactive et de la perception visuelle y reste centrale et fondatrice de la portée cognitive du concept. Jankun-Kelly fait référence à la visualisation comme une représentation graphique et interactive dont la finalité est directement liée à la résolution de problème (Purchase et al. 2008, 58), rejoignant le concept d’aide externe cognitive explicité par Scaife et Rogers (1996) et Ware (2000, 1).

Dans une série dédiée aux fondamentaux de l’interaction homme-machine, Card formule plusieurs assertions, venant confirmer l’ancrage de l’effet de la visualisation dans les sciences cognitives, sous-tendu par un arrimage effectif de technologies.

Information visualization is a set of technologies that use visual computing to amplify human cognition with abstract information. (Jacko, Sears, et Card 2003, 542)

Excepté la référence au « set of technologies that use visual computing » désignant composantes du modèle théorique de la visualisation d’information (Card, Mackinlay et Shneiderman 1999, 17), cette « nouvelle » définition confirme sans grande nuance la définition proposée dix ans auparavant. En revanche, il explicite l’amplification de la cognition par la réduction du temps de traitement de l’information que permet la perception visuelle de l’information.

Information visualization promises to help us speed our understanding and action in a world of increasing information volumes. (Jacko, Sears, et Card 2003, 542) Il distingue la visualisation d’information de la simple représentation iconographique et montre qu’elle n’existe que par son effet d’amplification cognitive grâce au prolongement externe et dynamique des capacités analytiques du cerveau qu’elle génère.

The purpose of information visualization is to amplify cognitive performance, not just to create interesting pictures. Information visualizations should do for the mind what automobiles do for the feet. (Jacko, Sears, et Card 2003, 539)

D’autres définitions sont proposées mettant plus l’accent sur le processus de communication de l’information à travers le dispositif de visualisation, que sur les finalités cognitives. Selon Chen (2005, 12) ou Keim et al. (2006, 10), la visualisation se définit plus par son rapport à l’information, sa nature abstraite, et à sa communication à travers un espace physique, celui de l’écran, et un espace temporel, celui de l’activité d’analyse. L’emphase est portée sur le rapport entre l’abstraction de l’information et sa communication concrète par sa structuration en vue de mise en forme graphique et interactive.

We broadly define information visualization as visual representations of the semantics, or meaning, of information. In contrast to scientific visualization, information visualization typically deals with nonnumeric, nonspatial, and high- dimensional data. (Chen 2005, 12)

We define information visualization more generally as the communication of abstract data through the use of interactive visual interfaces. (Keim et al. 2006, 10)

Enfin, d’une perspective plus centrée sur l’interaction homme-machine, Catherine Plaisant, une des chercheures de renom dans le domaine, dans une de ses notes de cours sur la visualisation d’information, propose une définition synthétique où la visualisation en tant que dispositif graphique et interactif est bornée par les types de motifs d’information qui en résultent et par les types d’analyses qui peuvent en être faites par l’utilisateur final :

[Information visualization is] compact graphical presentation and user interface for : manipulating large numbers of items, possibly extracted from far larger datasets ; enables users to make : discoveries, decisions or explanations about patterns (trend, cluster, gap, outlier…), groups of items, or individual items. (Shneiderman 2000, 12)

Plus sommairement, Robert Spence (2007, 5) établit le lien cognitif entre la représentation visuelle d’information et la formation de modèle mental comme constitutive de la visualisation d’information :

Information visualization is defined as the process of creating mental models of visually represented data. (Spence 2007; Kalawsky 2009, 121)

2.2.1.2.2 Modèle de référence

Finalement, toutes ces définitions s’accordent implicitement ou explicitement sur le principe d’amplification de la cognition et du rôle de la mise en forme graphique et interactive des informations abstraites à cette fin. Pour les chercheurs de la discipline, cette définition a permis de délimiter le cadre théorique et d’y articuler le potentiel effectif de la visualisation de l’information sous la forme d’un modèle de référence, formulé initialement par Chi et Riedl (1998, 67) et reformulé en 1999 par Card, Mackinlay et Shneiderman (Figure 7, 80).

Figure 7 Modèle de référence de la visualisation d’information (d’après Card, Mackinlay et Shneiderman 1999, 10 [notre traduction])

Ce modèle a l’avantage d’appuyer le rôle central de l’interaction sur le nécessaire processus de structuration effectué par le système, et sur le processus humain cognitif. Ce rôle interactif est contraint d’un bout à l’autre par les techniques existantes et la compréhension du processus de l’utilisateur, lequel est conditionné par sa tâche. Ce modèle et la définition de la visualisation d’information servent de structure à l’ensemble de la présentation des fondements théoriques attribués à la visualisation d’information.

À partir de ce modèle de référence, nous présentons tout d’abord les principes et propriétés techniques qui assurent la structuration de l’information abstraite en un objet informationnel concret (transformation en une unité de sens informatiquement manipulable) et la structuration visuelle (graphique et interactive). Puis, dans un deuxième temps sont déclinés les principes et propriétés graphiques et interactives, et enfin les principes et propriétés cognitifs.

Nous entendons par « propriété » une caractéristique concrète, une qualité de la visualisation que l’on peut désigner et identifier. Par « principe », il est entendu une proposition à partir de laquelle plusieurs propriétés graphiques peuvent être associées, constituant l’essence de la visualisation d’information. Par exemple, le langage visuel est une propriété graphique qui sous- tend et concrétise le principe de sémiologie graphique (cf. section suivante 2.2.1.3.1, 81).

2.2.1.3 Propriétés et principes graphiques

Selon Ware (2000), deux approches du processus de visualisation ayant un impact sur l’analyse du rôle des éléments graphiques coexistent :

- Celle (cf. section 2.2.1.3.1, 81), défendue par Purchase et al. (2008, 47), où ce processus relève de l’interprétation sémiologique d’un langage visuel (Bertin 1977 re-ed. 2005; Tufte 1983). Il s’agit à partir d’une analyse de l’usage et d’une perspective sémiologique d’établir les principes théoriques d’un « art de la visualisation ».

- Celle (cf. section 2.2.1.3.2, 84), exposée par Ware (2000), fondée sur les lois psychologiques de la perception comme les lois de la Gestalt (Kofka 1935), les capacités et les limites de la vision oculaire. Ware la présente, à ce titre, comme une « science de la visualisation » s’opposant de par les règles perceptuelles à l’approche exclusive de l’« art de la visualisation ».

Plusieurs ouvrages fondamentaux ont été publiés sur le langage visuel (Bertin 2005) et sur le système psychologique visuoperceptuel (Ware 2000) encadrant la compréhension d’universaux et principes formels et graphiques (Koffka 1935; Tufte 1983; 1990). Bertin est considéré comme le père fondateur de la sémiologie graphique en tant que théorie. Ware (2000) a consacré un ouvrage théorique au rôle de la perception visuelle dans la visualisation d’information. En revanche, Koffka (1935), dans la Gestalt Theory ou Théorie des formes, a extrait des principes de relations entre des formes disposées dans l’espace graphique, relations que l’on perçoit et auxquelles on attribue du sens. Tufte (1983; 1990) est largement reconnu pour l’analyse des différentes techniques graphiques et formes de visualisation.

On constate que si les approches sémiologiques et perceptuelles sont différentes dans leur esprit, les universaux graphiques de Bertin et la théorie des formes se corroborent et se complètent dans l’interprétation de l’affichage graphique, lorsqu’utilisés selon certains principes (Tufte 1983; 1990).

2.2.1.3.1 Principes sémiologiques : l’arbitraire du signe

Tout comme l’écriture signifie l’information dans un langage textuel, la représentation graphique, une des composantes de la visualisation, vise à rendre signifiante l’information dans un

As a starting point, we liken the understanding of visualization to the understanding of ideas expressed in language. (Purchase et al. 2008, 47)

In essence, the language argument is as follows : Visualization is about diagrams and how they can convey meaning. (Ware 2000, 5)

Par langage, il est entendu deux fonctions la représentation et la communication. Il s’agit donc d’avoir recours à une sémiotique du visuel (au sens de mettre sous forme signifiante le référé [l’idée] par un référant graphique) à l’aide de la représentation graphique. Dans notre cas de figure, il s’agit donc de représenter par des signes et conventions graphiques les résultats de recherche. Ware (2000, 5) évoque les symboles dans le cas des diagrammes, qui sont majoritairement le type de graphique dédié à la visualisation des résultats de recherche.

Diagrams are generally held to be made up of symbols, and symbols are based on social interaction. The meaning of a symbol is normally understood to be created by convention, established in the course of one-to-one person communication. Diagrams are arbitrary and are effective in much the same way as the written words on this page are effective – we must learn the conventions of the language, and the better we learn them, the clearer that language will be. (Ware 2000, 5)

Le langage visuel a un long historique (Bertin 2005, 7) et diffère selon les contextes d’application et selon les types d’information à visualiser, lesquels résultent d’opérations de structurations, par exemple statistiques, géographiques ou encore scientifiques (Tufte 1983). Les données « abstraites » sont généralement issues d’opérations mathématiques, par exemple le calcul du taux de mortalité. Par conséquent, leur sens dépend de la logique de ces opérations. La visualisation d’information a pour objectif de représenter ces données et leur sens au sein d’une structure graphiquement présentée qui en conditionne la lecture et l’interprétation. La représentation graphique est un système monosémique, c’est-à-dire qu’elle repose sur le système de perception visuel, de telle sorte que « le travail de lecture se situe entre les significations ». Employer un système monosémique, c’est faire le choix de :

consacrer à la réflexion un moment, pendant lequel, dans un certain domaine et durant un certain temps, tous les participants s’accordent sur certaines significations, exprimées par certains signes, et conviennent de ne plus en discuter. Cette convention permet alors de discuter de l’assemblage des signes et d’enchaîner les propositions dans une succession d’évidences, succession qui peut alors devenir « indiscutable », c’est-à-dire « logique ». C’est l’objet de la mathématique, dans les systèmes liés à la tridimensionnalité de la perception spatiale. Sur ce point, graphique et mathématiques sont semblables et construisent le moment rationnel.

Outre la relation logique entre la représentation graphique et la logique mathématique, la représentation graphique grâce au système visuel qu’elle convoque, permet de s’abstraire des contraintes linéaires et temporelles de la lecture de chacune des données issues des opérations mathématiques. Le principe consiste à utiliser la logique mathématique pour structurer l’espace graphique sur trois dimensions de codification visuelle (la variation des tâches et les deux dimensions du plan), lesquelles sont directement perceptibles et interprétables, une fois les conventions admises ou apprises. Dans le contexte de la visualisation des résultats de recherche, il s’agit justement de mettre en évidence les structures logiques extraites à l’aide d’algorithmes de fouille de texte, selon plusieurs niveaux de détails, qui relient sur la base de logiques sémantiques le contenu de chacun des résultats.

D’autres principes graphiques sont établis à partir de l’analyse des représentations graphiques d’information abstraite. Ces principes d’usage de la représentation graphique peuvent aussi avoir valeur d’exemples des principes issus du système graphique de Bertin ou de Koffka (1935). Tufte conclut son analyse des visualisations de données statistiques par des recommandations pragmatiques et générales à toute conception de représentation graphique. Ces recommandations complètent les principes en amont dans la mesure où celles-ci articulent la fonction d’une représentation – ici, dans un contexte de communication statistique – et une combinaison de signes graphiques permettant de convoyer le message renfermé par les données, les informations statistiques.

Selon Tufte, l’excellence dans la conception de graphique statistique repose sur la clarté, la précision et l’efficacité. Pour ce faire, et sur la base de l’analyse d’un large corpus de graphiques statistiques, il propose une liste de principes génériques garants de clarté, précision et efficacité. L’atteinte de ces critères de qualité (clarté, précision et efficacité) est contrainte par les contingences de la représentation graphique.

Certains principes s’adressent directement au traitement des données et à leur mise en scène en général (Tufte 1983, 13) :

show the data

present many numbers in a small space

reveal the data at several levels of detail, from a broad overview to the fine structure be closely integrated with the statistical and verbal description of a data set

D’autres sont focalisés sur le rapport entre les données et leur signification qui émerge de leur représentation graphique ou qui est explicité par la représentation graphique (Tufte 1983, 13) :