• Aucun résultat trouvé

peuvent-ils limiter l’engagement d’un internaute dans l’exploration personnelle et efficace de données et

comment remédier à ces limitations ?

Afin d’opérationnaliser cette question, je propose tout d’abord de mieux définir les audiences auxquelles les visualisations d’informations de données ouvertes sont adressées. Ensuite, je décris les difficultés liées à leur dé- ploiement sur Internet. Enfin, j’identifie quatre sous-coûts de Ce (les quatre obstacles mentionnés plus haut) à l’aide d’une analogie avec la théorie du

butinage d’informations (5).

Je définis les audiences de la visualisation de données ouvertes comme des audiences occasionnelles, par opposition aux audiences expertes. Je les distingue de ces dernières de la manière suivante : les audiences occasion- nelles sont 1) des individus qui sont généralement confrontés à la visuali- sation en tant que média sur Internet (et non en tant qu’outil de travail), ce qui laisse supposer qu’ils les scruteront certainement à la va-vite, si tant est qu’ils les regardent ; et 2) des individus qui n’ont pas nécessairement de connaissances particulières sur le sujet ou le domaine traité par les données, ni sur les systèmes de visualisation d’informations.

Concernant 1), il est bien connu que l’attention d’un internaute est généralement très limitée ; Nielsen estime que le temps moyen passé sur une page web est inférieur à une minute [28]. Toutefois, Liu et al. [192] ont montré que la navigation sur internet est sujette à un effet de vieillissement

négatif (6), c’est-à-dire que les internautes ont tendance à scanner rapide-

5 Traduction personnelle de l’anglais information foraging. 6 Traduction personnelle de l’anglais negative aging.

Résumé Étendu viii

ment une page web avant de décider de ‹ creuser › pour y trouver de l’in- formation. Durant cette phase, la probabilité qu’ils quittent la page est très forte, mais s’ils la dépassent, cette probabilité diminue et les internautes passeront plus de temps à lire et à explorer le contenu de la page.

Concernant 2), un des problèmes spécifiques de la visualisation sur In- ternet est qu’elle permet généralement des interactions bien plus riches — et donc complexes — que les traditionnels scrolls et clicks sur des hyperliens des pages ‹ classiques ›. Il faut donc que l’internaute soit au courant de ce potentiel interactif, ainsi que de sa richesse. S’il ne comprend pas l’interac- tivité, il se peut qu’il ne perçoive pas le média comme étant intéressant et il en préférera sûrement un autre (comme du texte par exemple), même si le sujet des données est susceptible de l’intéresser.

Ainsi, j’insiste sur l’importance de considérer Ce lors de la concep- tion de visualisations pour des audiences occasionnelles. J’estime que ces coûts sont une des raisons principales pour lesquelles un internaute pourrait négliger un site de visualisations ; celui-ci doit donc non-seulement être

attirant visuellement, il doit aussi engager l’utilisateur à interagir — afin que

ce dernier puisse aller au-delà de la surface de la représentation visuelle. La théorie du butinage d’informations [222] suggère que des indivi- dus à la recherche d’informations sont continuellement en train de navi- guer entre des lopins d’informations (7), guidés par l’odeur de l’information (8).

Ces lopins sont des régions dans lesquelles l’information est compilée (par exemple des sites web) et l’odeur est l’estimation faite par l’internaute du potentiel informatif de chaque lopin. Cet odorat se développe par la pratique et l’expérience, mais l’odeur peut être renforcée par le design. Selon Nielsen, l’idée principale derrière la théorie du butinage d’informations est l’analyse des coûts et des bénéfices pour la navigation (ou l’exploration) [29].

En considérant les visualisations d’informations sur Internet comme des lopins, il est important de considérer qu’il ne sont pas les seuls et qu’ils sont donc sans cesse en compétition avec d’autres. Si l’odeur d’autres lopins

7 Traduction personnelle de l’anglais information patches. 8 Traduction personnelle de l’anglais information scent.

Résumé Étendu ix

(comme des sites utilisant des médias plus traditionnels comme le texte) est plus forte pour l’internaute, ou si l’odorat de ce dernier est plus habitué à ces odeurs, le ratio coûts/bénéfices sera sans doute élevé. Plus spécifiquement, si l’internaute a le choix entre un site A de visualisations et un site B qui ne comprend que du texte et s’il n’a pas l’habitude de ‹ lire › des graphiques, son odorat l’amènera sans doute vers le site B puisque le coût d’apprentis- sage du nouveau média lui paraîtra trop important. Dans ce manuscrit, je nomme ce coût le coût de la littératie.

De la même manière, l’aspect souvent générique des visualisations fait qu’elles ne communiquent pas le sujet des données. Il faut donc que l’inter- naute passe un certain temps à lire différents titres, labels et autres éléments textuels pour comprendre le contexte de la visualisation avant même de pouvoir commencer à extraire de l’information. Ce coût peut réduire l’odeur de l’information et peut réorienter l’internaute vers un autre lopin. Dans ce manuscrit, je nomme ce coût le coût de l’interprétation du contexte.

De plus, la visualisation est un média à fort potentiel interactif, ce qui n’est pas le cas de nombreux autres médias sur Internet. Si l’internaute arrive sur un site de visualisations en s’attendant à une interaction passive [[164], [245]] et si la visualisation ne fournit pas d’indice sur son interactivité, alors le coût de la découverte ‹ à l’aveugle › des fonctionnalités interactives sera susceptible de mener l’internaute vers un autre lopin. Dans ce manuscrit, je nomme ce coût le coût de la perception d’interactivité.

Enfin, si l’internaute parvient à surmonter tout ces coûts, mais qu’il lui manque des connaissances sur le sujet des données, il aura sans doute du mal à formuler des questions initiales pertinentes et intéressantes. Ceci peut alors entraîner un manque de motivation pour explorer les données qui peut entraîner l’internaute vers un autre lopin. Dans ce manuscrit, je nomme ce coût le coût de la motivation initiale [à explorer des donner].

En somme, la visualisation d’informations n’est qu’un média par- mi d’autres sur Internet. Les audiences occasionnelles n’ont pas forcément l’habitude de ‹ lire › ce média et peuvent en préférer d’autres si ces derniers leur demandent moins d’efforts (c’est-à-dire s’ils sont moins coûteux). Dans ce manuscrit, je considère les coûts identifiés ci-dessus, qui sont une

Résumé Étendu x

décomposition des coûts de la perception et de l’exploration de van Wijk, comme les quatre obstacles à l’engagement. Mon hypothèse est que d’aider les audiences occasionnelles à les surmonter favorisera l’engagement de ces personnes dans l’exploration personnelle et efficace des données ouvertes.

Pour finir, afin d’opérationnaliser ma question de recherche princi- pale en prenant en considération chacun des ces coût, je propose les quatre questions ci-dessous :

* Q1: Comment un designer peut-il savoir si une audience est capable de comprendre différents types de représentations visuelles de données ?

* Q2 : Comment designer une visualisation afin qu’elle illustre immédiatement son contexte ou la sémantique des données qu’elle encode ?

* Q3 : Les internautes ont-ils l’habitude d’interagir avec des visualisations – spécifiquement quand celles-ci sont intégrées dans des pages qui contiennent aussi du texte – et, si ce n’est pas le cas, comment les designers peuvent-ils aider ces utilisateurs à détecter le potentiel interactif des visualisations d’informations ?

* Q4 : L’intégration d’incitations à explorer les données dans le design d’une visualisation peut-elle motiver les audiences occasionnelles à aller au-delà de la simple représentation par défaut ?

Pour répondre à ces questions, et plus généralement au problème de l’enga- gement des audiences occasionnelles dans l’exploration de données, j’adopte deux approches : une approche expérimentale et une approche design. Cette complémentarité est l’une des principales originalités de ce travail.

Pour Q1, j’adopte une approche expérimentale afin de montrer l’exis- tence du problème de la littératie en visualisation et pour mesurer le niveau de compétences des gens. Pour l’instant, je définis grossièrement la littératie en visualisation comme la capacité à utiliser efficacement et en toute confiance

Résumé Étendu xi

des visualisations pour extraire de l’information de données. Pour Q2, j’adopte

une approche design pour trouver une manière de communiquer le contexte d’une visualisation. Pour Q3, j’adopte d’abord une approche expérimentale pour montrer qu’une majorité d’utilisateurs non avertis ne cherchent pas à interagir avec des visualisations, puis j’adopte une approche design pour trouver des moyens de suggérer leur interactivité. Enfin pour Q4, j’adopte une approche expérimentale pour déterminer si certaines conventions de design de visualisations peuvent servir à engager des audiences occasion- nelles dans l’exploration de données.

Résumé Étendu xii

Mesurer le Coût de la Littératie: Une