• Aucun résultat trouvé

État de l’art

1.1 Assistance aux utilisateurs d’applications informatiques

1.1.4 Aides multimodales et dialogiques

Dans cette section, nous considérons qu’une modalité est définie à la manière de Bouchet et al. [2004]; Nigay & Coutaz [1995], c’est-à-dire comme un couple <d, L> constitué par un périphérique physique (physical device) d doté d’un langage d’interaction L. Il convient par ailleurs de distinguer les modalités en entrée (la façon dont l’utilisateur fait appel à l’assis-tance) des modalités en sortie (la façon dont le système d’assistance se manifeste auprès de l’utilisateur).

1.1.4.1 Attentes et objectifs

Si la contextualité vise à résoudre le problème du fossé cognitif, les problèmes 1 et 2 de la section 1.1.2.3 demeurent entiers. Ils sont pourtant primordiaux, car même un CHS idéal n’aurait que peu d’utilité si les utilisateurs ne veulent pas l’utiliser et/ou sont perturbés par sa présence.

Capobianco [2002], déjà mentionné dans 1.1.3.3, a également permis d’observer que lorsque les utilisateurs interagissaient avec des expertshumains, quand bien même en termes de per-formances ceux-ci simulaient celles du système, ils faisaient appel à leur aide dans environ deux tiers des tâches, ce qui est significativement plus que ce que l’on observe avec une aide logicielle. Ils tendent également à s’exprimer de manière différente lorsqu’ils s’adressent aux

experts humains que lorsqu’ils s’adressent au système [Amalberti et al. ,1993]. Cette

obser-vation démontre que bien plus que la compétence réelle, le paradoxe de la motiobser-vation est aussi lié à un besoin d’interaction “naturelle” : un système d’assistance traditionnel présente de nombreuses restrictions d’utilisation. Une solution intéressante consiste à faire appel à des modalités différentes, et en particulier à la langue naturelle via le dialogue.

1.1.4.2 Apports et limites de la multimodalité en sortie

Parmi l’ensemble des modalités en sortie recensées [Bernsen,1994], sur un système infor-matique classique comme celui utilisé par la plupart desnovicesdoté essentiellement de deux périphériques en sortie (écran et haut-parleurs/casque), on peut en lister au moins cinq :

Les instructions écrites <écran, langue naturelle écrite> : qui est celle par défaut des systèmes d’aide, aussi bien statiques que dynamiques.

Les instructions orales <haut-parleurs, langue naturelle parlée> : la synthèse de parole a été assez peu étudiée dans le cas de l’assistance. Dans le cas d’instructions à exécuter, il semble que les utilisateurs soient plus rapides pour effectuer les tâches demandées (éventuellement réalisables au fur et à mesure de l’écoute), mais préfèrent toutefois disposer du texte [Harrison, 1995]. Il semble en outre probable que comme dans le cas des animations, faute de temps pris pour analyser les actions effectuées, la capacité à transposer le savoir ainsi acquis soit réduite. En outre, cette modalité n’est réellement utile que si les instructions sont courtes, car dans le cas contraire, l’utilisateur ne parvient pas à les mémoriser [Carbonell & Kieffer,2005].

L’illustration <écran, image statique> : combinée avec la modalité textuelle, par exemple en ajoutant des icônes au texte [Morrell & Park,1993] ou des illustrations de l’état du système [Harrison,1995], elle permet une amélioration des performances observée dans la réalisation de tâches.

L’animation <écran, image animée> : l’intérêt de graphiques animés complémentaires est plus controversée : pourPalmiter & Elkerton[1991], elles augmentent la mémorisation à long terme, mais cela se fait au détriment de la lecture du texte et conduit à une simple imitation plutôt qu’à une compréhension permettant de transposer les acquis. Harrison

[1995] trouve des résultats comparables, mais montre que l’apport de l’animation est peu significatif lorsqu’il s’agit uniquement de montrer une succession d’étapes ou des mouvements du curseur.Tversky et al. [2002] est plus critique et pense que l’animation n’apporte rien qu’un ou plusieurs schémas comportant la même quantité d’informations ne pourraient apporter – pire, l’animation pourrait être contre-productive en étant dif-ficile à percevoir et interprétée de manière erronée comme une succession d’éléments discrets.

La déictique <écran, mise en évidence d’une zone> : l’utilisation d’animations pour aider à focaliser l’attention est en revanche en règle générale clairement efficace, que celle-ci se fasse par l’utilisation de la surbrillance, d’un pointeur, de zooms [Bederson et al. ,

1996] ou de vue en œil-de-poisson [Furnas,1986], même si ces différentes techniques ne semblent pas avoir été étudiées spécialement dans le contexte de l’assistance.

Bien que les études sur la modalité graphique en sortie soient nombreuses, dans le cadre particulier de l’assistance, son utilisation est problématique puisqu’elle fait d’autant plus em-piéter le système d’aide dans l’espace visuel bien souvent occupé par l’interface de l’application assistée. L’ajout d’un écran secondaire est un palliatif possible [Capobianco, 2002] mais cela demeure une solution coûteuse et pas forcément toujours applicable.

1.1.4.3 Apports et limites de la multimodalité en entrée

En ce qui concerne les modalités employées en entrée pour l’accès à l’aide, on trouve essentiellement :

La navigation classique <souris, pointer-et-cliquer> : il s’agit du mode d’interaction tra-ditionnel avec les systèmes d’aide dotés d’hyperliens, en utilisant la souris comme péri-phérique d’entrée pour le pointage. Face au développement des interfaces tactiles, no-tamment pour les téléphones portables, on pourrait aussi envisager l’utilisation de la modalité <écran tactile, toucher> de manière relativement similaire.

La recherche écrite <clavier, mots-clés> : la recherche par mots-clés est l’autre mode clas-sique de navigation au sein d’un système d’assistance. Il suppose de connaître le voca-bulaire technique employé par le concepteur de l’aide et le principe de recherche par mots-clés (pas forcément intuitif pour des novices), mais aussi d’avoir une certaine fa-miliarité avec le périphérique de saisie employé (clavier) pour que son utilisation ne perturbe pas davantage un usager déjà en situation de détresse cognitive.

Les requêtes écrites <clavier, langue naturelle écrite> : l’accès aux informations n’est plus perçue comme de la navigation dans une base de connaissances mais comme un dia-logue [Amalberti, 1996]. La demande d’assistance se fait selon le même langage utilisé pour demander de l’aide dans des contextes différents (par exemple demander son chemin dans la rue). À défaut de faciliter l’interaction pour les utilisateurs peu efficaces dans l’utilisation du clavier, le passage d’un système de mots-clés à la langue non contrainte libère l’utilisateur d’un apprentissage préalable (se faisant souvent par tâtonnement) des limites du langage. Visuellement, l’ajout d’un champ texte en bas de la fenêtre est relativement peu intrusif.

Les requêtes orales <microphone, langue naturelle parlée> : l’utilisation de la langue na-turelle orale et non contrainte n’a que peu d’impact sur l’efficacité de la réalisation d’une tâche : c’est d’ailleurs ce qui permet d’employer la méthodologie du “thinking aloud” pour l’étude de l’interaction homme-machine [Ummelen & Neutelings,2000]. En outre, il s’agit d’une modalité particulièrement intuitive, et même souvent spontanée chez les

no-vices. Cette modalité n’a aucune intrusivité visuellement, mais la reconnaissance vocale

requiert souvent l’usage d’un dispositif de type micro-casque, généralement pas utilisé le reste du temps, et dont le bon fonctionnement nécessite une configuration (par lecture de texte à voix haute) qui peut prendre un certain temps.

La déictique <souris, pointer> ou <écran tactile, toucher> : de manière complémentaire à la langue naturelle parlée, il est possible à l’utilisateur de désambigüiser les références faites à des éléments de l’interface en les pointant (avec le doigt ou un stylet dans une interface tactile, ou avec le pointeur de la souris dans une interface plus classique). L’intérêt essentiel de l’utilisation de la multimodalité pour l’assistance consiste à faire employer à l’utilisateur une autre modalité que celle(s) utilisée(s) pour l’interaction avec le système lorsqu’il souhaite avoir recours au système d’aide. Cette séparation en termes de

modalités permet de renforcer mentalement la distinction entre la tâche principale à réaliser et la sous-tâche “recherche d’assistance”, et donc de réduire l’intrusivité de l’aide en ligne (problème 2). À ce titre, l’utilisation de requêtes écrites ou orales semble être ce qui permet le mieux cette distinction [Capobianco & Carbonell,2006]. Leur utilisation induit par ailleurs la possibilité de modifier le fonctionnement des modalités <écran, langue naturelle écrite> et <haut-parleurs, langue naturelle parlée> qui peuvent dès lors être utilisées pour transmettre les réponses sous forme de phrases et ainsi simuler un véritable dialogue avec le système.