• Aucun résultat trouvé

2.2 La visualisation d’information

2.2.3 Les apports théoriques de la visualisation des résultats de recherche

Dans la majorité des études comportant une évaluation formelle, les objectifs visent la vérification des présupposés issus de la théorie de la visualisation d’information. Qu’il s’agisse d’une composante précise ou qu’il s’agisse de l’ensemble du système, l’idée est que le dispositif visuel de présentation des résultats de recherche, au sein d’un paradigme d’interaction orienté sur la navigation, apporte un soutien au repérage, mais aussi à la recherche d’information permettant diverses stratégies interactives pour accéder à l’information.

Dans cette partie, nous recensons les apports de la visualisation, et les systèmes ou composantes censés les représenter, avec les références des études correspondantes.

2.2.3.1 Un système ou un dispositif visuel facilite la navigation des résultats de recherche

Théoriquement, la visualisation des résultats de recherche a pour objectif de tirer partie de ce que peuvent révéler l’ensemble des résultats de recherche plutôt que sur les seuls quelques premiers. La visualisation des résultats de recherche dans ses applications vise en général à favoriser l’exploration et l’analyse des résultats en proposant différents contextes et différentes manières de naviguer à travers les résultats grâce aux vues interactives, transformations issues de la représentation graphique. La navigation – « browse » - est une dimension de la recherche qui est exploitée par la visualisation des résultats de recherche, afin d’enrichir l’expérience de recherche de l’utilisateur, et de lui permettre de mieux explorer, analyser et éventuellement de mieux préciser et, ce faisant, de mieux reformuler son besoin informationnel à travers ses requêtes.

En effet, des systèmes ont été conçus en endossant intégralement cette orientation interactive favorisant la navigation – le « browsing » – dans l’architecture du système visuel de recherche d’information. On pense au système VIBE « Visual Information Browsing Environment », évalué par Koshman (1996) ou au système BIRD « Browsing Interface for Retrieval Document », conçu et évalué par Kim et Korfhage (1994). Le prototype de Hoeber (2007), ConceptMap, qui propose une visualisation des concepts en contexte de recherche d’information Web, s’appuie aussi sur l’apport au niveau du repérage et de la découverte que peut constituer la navigation d’une carte de concepts issus des résultats de recherche. Pareillement, Taylor (2009, iv) appuie sa thèse sur le fait que la visualisation aide la navigation à travers les résultats de recherche.

À travers les études du corpus, ce que l’on voit apparaître c’est que l’aide à la navigation que constitue la visualisation des résultats de recherche est un mode d’accès fondé sur l’usage de la perception visuelle, et aussi le point de départ des autres fonctionnalités interactives associées au dispositif. La visualisation des résultats de recherche aide à la navigation interactive parce que ce mode de représentation graphique avec différentes vues à disposition invite l’utilisateur à explorer pour faire du sens de ce qui lui est donné à voir. La visualisation offre une lecture multidimensionnelle de l’information en conditionnant la navigation selon sa structure graphique, tout comme la liste des résultats de recherche ordonnés impose une logique de lecture des résultats selon l’ordre de leur apparition.

2.2.3.2 La visualisation assiste le repérage des résultats et leur analyse

La visualisation des résultats de recherche qui s’impose à l’œil de par ses propriétés structurelles graphiques assiste le repérage de l’information. Pour ce faire, les études évoquent la possibilité de repérer visuellement – grâce aux attributs graphiques associés aux résultats de recherche – l’information pertinente. En effet, dans son système GUIDO (Graphical User Interface for Document Organization) présenté dans sa thèse de doctorat (1996), Nuchprayoon fonde son modèle de visualisation en offrant des points d’accès multiples pour le repérage d’information. Le système DARE, développé par Zhang, fonctionne aussi ce modèle de visualisation qui donne plusieurs options pour repérer les résultats de recherche.

La représentation graphique du TileBars de Hearst (1995) est aussi éloquente en termes de repérage d’information au sein des résultats et des possibilités analytiques qui s’en dégagent. Tout d’abord, la condensation d’information qu’opère la visualisation grâce à l’utilisation de présentation graphique facilite le traitement et la mémorisation de l’information représentée. Elle aide à gérer le phénomène de surcharge informationnelle qui oblige souvent, dans le cas des listes de résultats de recherche, à ne pas entreprendre une exploration de l’ensemble des résultats de recherche. Avec le TileBars (Figure 18, 112), il est rendu possible de traiter, d’analyser, cent résultats selon la visualisation des résultats de recherche proposée.

Figure 18 : Interface visuelle des résultats de recherche du système « TileBars » de Hearst (1995, 63)

Dans cette représentation du « TileBars », chaque document est représenté par une barre rectangulaire divisée par des carrés de teinte différente : de foncé à clair. Le document « résultat de recherche » est décomposé en une série de petits carrés dont la teinte varie en fonction de la fréquence des termes de la requête.

2.2.3.2.1 Interfaces de systèmes visuels de recherche d’information exploratoire sur le Web Dans le même ordre d’idée, plus récemment et pour un système de visualisation des résultats de recherche sur le Web, les interfaces développées par Hoeber (2007) et évaluées par Hoeber et Yang (2008, 495-508) visualisent aussi les résultats de recherche de sorte que la présence et la fréquence des termes de la requête soient représentées soit sous la forme d’une carte de chaleur dénommée « HotMap » (Figure 19, 113), soit sous la forme d’un histogramme des termes de la requête dénommée « WordBars » (Figure 20, 114).

Figure 19 La visualisation des résultats de recherche « HotMaps » (Hoeber 2006)

© 2006 IEEE. Reprinted, with permission, from [Hoeber, The Visual Exploration of Web Search Result Using HotMap, IEEE Information Visualization, 2006. IV 2006. Tenth International Conference on, July 2006

Dans « HotMap », la distribution de fréquence des termes reprend les mêmes principes graphiques de représentation d’information. Dans la présentation avec « WordBars », il s’agit de la distribution de la fréquence des termes de la requête au sein d’un histogramme des autres termes les plus fréquents parmi les cents premiers résultats.

Figure 20 La visualisation du système WordBars ([Hoeber et Yang 2008, 486] avec permission de reproduction)

Dans l’instance du WordBars, les termes les plus fréquents juste après les termes composant la requête sont les termes « data » et « means ». Moins le terme est fréquent, plus la barre rapetisse.

Ainsi, comme le résume Kothari (2010) dans son étude de Carrot2Search, un autre système visuel de recherche d’information sur le Web développé par Stefansław Osiński et Dawid Weiss (© 2002-2015), la visualisation facilite le repérage en rendant visibles les relations entre certains attributs structurels sémantiques des résultats de recherche, et en permettant de conserver le contexte de chaque résultat de recherche, comme le préconise Shneiderman dans la stratégie « vue globale + détails ». Dans Carrot2Search, la classification qui est faite des résultats de recherche et qui les structure selon le fait qu’ils soient similaires sur la base de leur contenu ou distants, est représentée textuellement et visuellement. Un autre système visuel de recherche d’information web, LightHouse (Allan et al. 2001, 438) repose sa visualisation sur ce principe : les documents sont représentés par des sphères en 3D et sont regroupés s’ils sont similaires entre eux. Le principe de représentation en arrière-plan, si on se réfère à la théorie de la Gestalt est celui de la proximité.

Figure 21 Exemple de proximité visuelle selon la Gestalt Theory (image reproduite avec permission Koshman 2006b, 194)

Ce principe apparaît pour désigner l’inter-similarité des documents dans l’interface d’Allan et ses collaborateurs (2001), LightHouse : la distance ou la proximité des sphères représentent le lien d’inter-similarité qui les a- ou dissocie.

Figure 22 Interface de LightHouse (reproduit avec permission Allan et al. 2001, 455)

Dans Carrot2Search, pour la visualisation des classes, deux présentations sont proposées : soit sous la forme d’un cercle, soit, plus récemment conçue, sous la forme d’un dalles de trottoir ou d’écailles.

Dans la forme en cercle (Figure 23, 116), les principes graphiques, tailles des sections et communautés des couleurs, sont attribués selon le nombre de résultats contenus dans les classes. De ce fait, on peut identifier les classes de contenus similaires qui ont rappelé le plus de résultats de recherche similaires par rapport à la requête. On peut ainsi repérer immédiatement quelle classe et quelle « thématique » ramènent le plus de résultats de recherche. Toutefois, on ne perd pas la

présence des classes de moindre quantité de résultats, qui pourrait être ce qu’on appelle dans une distribution de type « longue traîne » des signaux faibles, néanmoins pertinents.

Figure 23 Aperçu d’écran de Carrot2Search (pris le 10 décembre 2015) — représentation circulaire des classes (© Stanislaw Osinki et Dawid Weiss 2002-2015)

La représentation en dalles de trottoir (Figure 24, 117) visualise graphiquement un attribut de plus, à savoir la proximité et la distance entre les classes. Ainsi, comme dans la représentation circulaire, plus la taille de la tuile est importante plus elle contient de résultats de recherche et plus elle est centrale. Inversement, moins de résultats sont contenus par la classe, plus elle est située vers l’extérieur. Enfin, cette visualisation qui s’apparente à ce qu’on appelle dans la littérature sur la visualisation d’information à une « treemap » ou « carte arborescente », représente graphiquement les liens de proximité et de distance existant entre les classes. En effet, les classes proches en termes de similarité de contenu se jouxtent et partagent la même teinte de couleur. Par contre, les classes qui semblent plus distinctes en termes de similarité de contenu se trouvent éloignées. Il est possible d’en déduire des liens thématiques, permettant de passer d’une classe à l’autre, et d’identifier la classe centrale comme étant la « racine » commune.

Figure 24 Aperçu d’écran de Carrot2Search (pris le 10 décembre 2015) — Représentation « pavée » des classes de résultats de recherche

En réduisant la surcharge informationnelle, en facilitant le repérage des résultats et les procédés analytiques consistant à les évaluer en les comparant, entre eux, par rapport à la requête et par rapport à nos propres connaissances, ces modalités de visualisation rendent l’espace informationnel concret et tangible et libèrent la mémoire de travail (Card, Mackinlay, et Shneiderman 1999, 7; Zhu et Chen 2005, 142; Koshman 2006b, 194‑196).

De plus, en rendant visibles les relations de proximité et de distance à différents niveaux (au niveau des résultats ou au niveau des classes), la visualisation permet de découvrir ce qui aurait pu demeurer caché. On accède ainsi selon Heo (2000, iii), qui a travaillé sur la visualisation et les modèles mentaux de l’utilisateur, à une nouvelle conception des informations et une nouvelle acception de l’étendue de l’espace informationnel. Les limites de l’espace informationnel sont tangibles graphiquement et interactivement grâce aux modalités de manipulation directes : combinaisons de vues, animations, focalisation, défocalisation, sélection, filtrage (cf. section 2.2.2, 91).

2.2.3.3 La visualisation des résultats de recherche assiste la reformulation des requêtes

Bien que la visualisation des résultats de recherche se manifeste sous la forme d’une interface qui est souvent conçue de manière à favoriser la navigation, mais elle ne délaisse pas

néanmoins l’aspect « requête ». Il existe même des systèmes visuels de recherche d’information, où la composante « visualisation » est axée sur la « requête ». En effet, selon les recommandations de Shneiderman, la visualisation appliquée à la recherche d’information intègre des modalités de requêtes dynamiques. La navigation des résultats de recherche « nourrit » le processus d’interrogation. La visualisation des résultats de recherche assiste l’expansion de la requête ou au contraire son raffinement.

Certaines interfaces visuelles de recherche d’information sont directement orientées sur ce type de fonctionnalité consistant à améliorer en priorité la qualité des requêtes ou à faciliter leur construction. Par exemple, le système InfoCrystal, à l’époque où les requêtes booléennes étaient fréquentes, a développé un langage visuel au niveau de l’interface des résultats de recherche pour créer la requête selon une logique booléenne. Un autre exemple, le système d’Hoeber, Yang et Yao, VisiQ (2007, 311), propose aussi une fonctionnalité de requête interactive. VisiQ fonctionne avec une base conceptuelle (ACM Computing Classification Sytem) et génère un « espace de requête » qui établit des liens entre des termes de requêtes et les concepts de la base. Cet espace est celui visualisé. L’utilisateur peut donc voir et interpréter les relations entre les termes et les concepts, et raffiner la requête interactivement.

Une autre manière de modifier dynamiquement des requêtes se fait par le recours aux fonctionnalités de filtrage dynamique. Cette fonctionnalité appliquée à la visualisation des résultats de recherche a été implantée la première fois dans l’interface du FilmFinder (Ahlberg et Shneiderman 1994). Plus récemment, on la retrouve dans le métamoteur SearchCrystal de Spoerri (Spoerri 2004a, 2004b, 2004). Celui-ci opérationnalise même cette technique de filtrage grâce à des vues coordonnées des résultats. D’un côté, on filtre et de l’autre, on voit immédiatement le résultat.

Roussinov et al. (1999) mettent à disposition un ensemble de fonctionnalités associées à leur carte auto-organisée et adaptative, et permettent interactivement de modifier la vue des résultats de recherche en permettant des altérations et des modifications assistées de la requête : la suppression de termes, le marquage de termes « proches » ou « distants » dans les résultats de ce que l’on cherche, la personnalisation de la carte, la possibilité de spécifier ou d’élargir la recherche, réduire ou augmenter le nombre de concepts à afficher, de relancer ou supprimer la requête.

De manière indirecte, les cartes conceptuelles visent à donner la possibilité par déduction de réorienter la requête. Pour Hearst, en observant la distribution des termes de la requête

visuellement dans chaque document représenté par un « TileBars », le but est de donner ces indices de fréquence pour, à terme, améliorer la requête booléenne.

2.2.3.4 La visualisation assiste la recherche d’information exploratoire

En 2007, Spoerri publie la première étude sur la visualisation des résultats de recherche en mentionnant explicitement son assistance à la recherche d’information exploratoire. Elle s’intitule « Coordinated linear and 2D displays to support exploratory search » (Spoerri 2007) et pose explicitement l’hypothèse comme quoi la visualisation peut être un dispositif d’assistance interactive à la recherche d’information exploratoire, telle que définie par Marchionini en 2006. Un an après, Hoeber et Yang (2008) proposent l’évaluation de WordBars, un dispositif visuel représentant sous la forme d’un histogramme les termes les plus fréquents présents dans les résultats de recherche, dans un contexte de tâche de recherche d’information exploratoire sur le Web. En 2010, Kothari réalise un mémoire de maîtrise évaluant l’efficacité de la visualisation de résultats de recherche classifiée dans un contexte de recherche d’information exploratoire. Il effectue l’évaluation du système Carrot2Search. En 2012, une thèse de doctorat est publiée par Dörk (2012) sur l’intérêt de la visualisation de l’information pour la recherche d’information exploratoire.

2.2.3.5 Conclusion

Il existe des apports, sur un plan théorique, de la visualisation des résultats de recherche au processus de recherche d’information exploratoire. Que ce soit dans un contexte de repérage d’information, comme au début des années 90, ou que ce soit dans un contexte de recherche d’information exploratoire, sur le Web ou dans un autre espace informationnel, la visualisation comporte des propriétés et repose sur des principes graphiques et interactifs qui, en théorie, soutiennent ou assistent les stratégies de recherche et les processus cognitifs en arrière impliqué par la recherche d’information exploratoire.

En effet, si l’on reprend les recommandations formulées par Marchionini (retranscrites et traduites dans la colonne 1 du tableau ci-après) pour développer des interfaces et des systèmes de recherche adéquats pour assister la recherche d’information exploratoire, on peut constater que la visualisation des résultats de recherche, de par ses propriétés graphiques et interactives que nous avons identifiées au fur et à mesure de la revue de littérature dans ce qui est reconnu comme ses

fondements théoriques et techniques, remplit la plupart des recommandations suivantes que nous avons dressées dans le tableau ci-dessous (Tableau III, 120) :

Tableau III Assistance fonctionnelle de la visualisation des résultats de recherche au processus de recherche d'information exploratoire

Recommandations pour les systèmes de recherche

d’information exploratoire Caractéristiques de la visualisation des résultats de recherche

Fournir des « aides » pour faciliter l’extraction du sens des informations

Représentation graphique des liens de proximité, de distance et de connectivité entre résultats

Vues combinées et coordonnées des résultats de recherche Augmenter l’effort intellectuel et le contrôle de

l’utilisateur sur son processus de recherche (et non sur le fait de trouver des stratégies pour compenser les déficiences du système) afin de « récompenser le bon effort »

Fonctionnalités de manipulation directe sur les modalités d’accès à l’information (niveaux de structure, filtrage dynamique, alternance de vues globales ou focalisées) Avoir une architecture suffisamment flexible pour

s’adapter aux exigences, expertises et compétences des

utilisateurs, qui augmentent au fil du temps. Modalités de filtrage, de spécification ou d’expansion de requêtes Faire partie intégrante de l’environnement informationnel

personnel et faire partie des outils de partage de mémoire

plutôt que constituer des systèmes à part. Modalités de représentation de l’état d’utilisation d’un espace mémoire avec ses métadonnées, i.e. les cartes arborescentes (tree map)

Assister le cycle intégral de l’information (de sa création jusqu’à sa préservation) plutôt qu’être uniquement actif au niveau de la diffusion ou de l’utilisation de

l’information.

Permettre le paramétrage et la configuration du système par les utilisateurs finaux, et particulièrement par les professionnels de l’information qui ajoute de la valeur aux ressources informationnelles.

Choix des types d’algorithmes de classification, marquage de résultats de recherche, parfois possibilité donnée de sauvegarder les résultats

Être invitant et amusant à utiliser

Le fait que les résultats de recherche sont concrétisés à travers la représentation graphique, l’usage de la couleur, les procédés d’animation de celle-ci, la capacité de contrôle et de manipulation de la visualisation rend l’interaction avec le système plus réactive et plaisante. Ce tableau est la synthèse de l’analyse des fonctionnalités interactives, graphiques et visuelles des différents systèmes visuels de recherche d’information précédemment présentés associées aux recommandations fonctionnelles de systèmes de recherche d’information exploratoire présentées (section 2.1.1.3, 64) par Marchionini (2006b, 21).

Ce tableau se lit de la manière suivante. La première colonne fait état des recommandations qui faciliteraient la recherche d’information exploratoire en matière d’interface. La seconde colonne qui lui fait face présente les fonctionnalités ou les caractéristiques propres à la visualisation qui répondent aux recommandations formulées.

Un système visuel de recherche d’information est une appellation que nous avons donné aux systèmes de recherche d’information qui intègrent une composante de visualisation que ce soit pour les résultats de recherche ou pour la requête. La plupart des systèmes visuels de recherche d’information (dénommé ensuite SVRI dans cette thèse) que nous avons examinés possèdent ces caractérisques sauf pour deux des recommandations (en grisé). En effet, nous n’avons pas trouvé d’exemples de SVRI qui s’inscrivaient dans ce contexte d’environnement informationnel. Néanmoins, pour d’autres applications comme des applications de partage d’environnement informationnel, des dispositifs de visualisation sont souvent utilisés pour représenter l’espace utilisé par les différentes informations en circulation et en dépôt sur le système.

2.3 L’évaluation de la visualisation des résultats de recherche en