• Aucun résultat trouvé

Dans l'optique d'une modélisation de mouvements oculaires nous verrons tout d'abord ce que sont les mouvements oculaires et comment les utiliser comme obser-vables du comportement humain. Nous verrons ensuite la notion d'acuité visuelle. Mouvements oculaires

Lors d'une recherche d'information visuelle, ou lorsque tout simplement nous posons notre regard sur le monde qui nous entoure, nous eectuons des mouve-ments oculaires, reets de notre activité cognitive. Ces mouvemouve-ments oculaires sont de plus en plus utilisés dans la recherche comme données objectives pour essayer de mieux comprendre le mécanisme de déplacement de l'attention dans l'environ-nement. Des expérimentations avec enregistrement des mouvements oculaires ont permis des avancées dans la compréhension des processus cognitifs dans diérents

Processus visuel 37 domaines. Au niveau de la lecture, plusieurs études ont ainsi montré quels mots ou quelles parties des mots sont xés, quels sont les taux de saccades régressives (qui reviennent sur un texte déjà vu), etc. Au niveau de la vision, citons entre autres les travaux de Henderson et al.(2007), qui montrent par une étude oculométrique que les modèles de cartes de saillance ne correspondent pas aux données expérimentales. En IHM (Interaction Homme Machine), les apports de l'utilisation de l'oculomètre pour recueillir des informations sur le comportement des utilisateurs sont là aussi conséquents (Chalon et al.,2001).

Ces enregistrements oculaires doivent être analysés pour nous apporter des infor-mations pertinentes, et contrairement à ce que l'introspection pourrait nous laisser penser notre regard ne se déplace pas de manière continue mais est une succession de xations, de saccades, et de micro-mouvements de moindres amplitudes.

Fixations, Saccades Les mouvements oculaires se divisent classiquement en des périodes de relative stabilité appelées xations qui alternent avec des périodes de mouvements rapides appelés saccades. Notre regard se déplace constamment et nous faisons en moyenne 2 à 3 xations par seconde. La durée des xations est très variable. En lecture, les xations durent en moyenne environ 250 ms (entre 50 et 500 ms typiquement). Elles sont en général un peu plus longues en recherche visuelle (275 ms) et en perception de scènes visuelles (330 ms). La durée des saccades est beaucoup plus brève. Une saccade de deux degrés1 (huit caractères), typique en lecture, dure environ 30 ms. Une saccade plus longue de 5 degrés, typique en perception de scène, dure environ 40-50 ms.

D'autres mouvements existent, telles les micro-saccades. Leur étude est plus ré-cente car les capturer avec un oculomètre demande une très grande nesse, qu'il était techniquement impossible d'atteindre il y a plusieurs années. Leur lien avec la charge cognitive est en débat, mais est évoqué dans certaines études (Steinhauer,2002). Acuité visuelle

Nous n'entrerons pas ici dans le détail de la physiologie de l'÷il, mais un bref aperçu nous permettra de comprendre la notion d'acuité visuelle qui sera intégrée dans notre modèle. La partie de l'÷il humain qui nous intéresse est la rétine, qui tapisse le fond de l'÷il. La lumière traverse les diérentes couches rétiniennes pour arriver sur les photorécepteurs, qui sont de deux types : cônes et bâtonnets. Les cônes sont dédiés à la vision diurne et aux couleurs tandis que les bâtonnets sont eux dédiés à la vision nocturne et en niveaux de gris. La répartition des photorécepteurs n'est pas uniforme sur la rétine. Les bâtonnets sont beaucoup plus nombreux dans la rétine périphérique. Les cônes sont très majoritairement dans la fovéa, et leur densité décroit avec l'excentricité (voir gure 2.6 page suivante).

1. Un degré dans le champ visuel équivaut à environ 1cm sur un écran situé à 57 cm, ou l'ongle du pouce à bout de bras.

Figure 2.6  Répartition des cônes (en noir) et des bâtonnets (en gris) sur la rétine en fonction de l'angle visuel. La fovéa est la région où la vision est la plus précise, grâce à sa forte densité de cônes.

Figure 2.7  Simulation de l'acuité visuelle en lecture (Hunziker, 2006). La xation est sur le mot four et nous voyons bien la dégradation de la vision autour de ce point sur la seconde ligne.

Cette répartition produit une variation dans l'acuité visuelle qui est maximale au centre de la rétine (fovéa) et chute considérablement en s'éloignant du centre. Les xations permettent de se placer sur les éléments dont nous voulons avoir une vision précise (exemple en lecture gure2.7). La forme générale de la distribution de l'amplitude des saccades lors d'une tâche de recherche visuelle ou d'exploration de scène nous montre que les trajets oculomoteurs comportent beaucoup de saccades de faible amplitude et peu de longues saccades. Cette observation est en accord avec l'acuité visuelle car les saccades sont faites vers des éléments proches de la fovéa. Un bon modèle de simulation de trajets oculomoteurs doit donc prendre en compte l'acuité visuelle an d'obtenir des distributions d'amplitude des saccades proches de celles observées empiriquement (Ho Phuoc, Guérin-Dugué, & Guyader, 2009). Au contraire, les modèles n'intégrant pas ce mécanisme de ltrage rétinien considèrent que toute l'image a une acuité maximale et la distribution de l'amplitude des saccades est alors proche de l'uniforme.

Pour une bonne simulation des parcours oculomoteurs, il nous est donc apparu nécessaire de prendre en compte cette notion d'acuité.

Processus sémantique 39

2.3.2 Pistes de modélisation

Grâce à l'observation des trajets produits par les participants dans les diérentes applications, nous avons mis en évidence deux types de comportement au niveau visuel. Le premier, que nous appellerons réactif ou local permet de rendre compte des contraintes locales lors de la pondération des éléments dans la carte visuelle. Ces contraintes prennent en compte plusieurs propriétés du système visuel : l'acuité visuelle, correspondant au fait que la qualité de la vision se dégrade rapidement en s'éloignant du point de xation, et la saillance visuelle indiquant que certains éléments ont des traits saillants attirant plus fortement l'attention que d'autres. Lorsqu'une xation est sur un élément, le choix de la xation suivante (pour le module visuel) est guidée par ces contraintes locales, indépendamment du parcours eectué jusqu'à présent ou de la page dans sa globalité contrairement au parcours global ou planié.

Le second parcours que nous appellerons planié dénote, lui, une activité globale qui opère au niveau de la page, par exemple dans le cas de documents structurés en plusieurs parties. Une vision d'ensemble est alors possible dès la présentation du matériel, indépendamment de la position de la xation courante. Cette récupération d'informations globale entraine la mise en place d'un schéma de parcours systéma-tique intégrant tous les éléments à visiter (comme nous l'avons vu dans l'exemple de parcours sur une page Web gure2.1 page 32). Cette stratégie globale implémente la notion cognitive de gist, c'est-à-dire une représentation schématique de la scène dans sa globalité, dès la ou les premières xations, (Thorpe, Fize, & Marlot,1996;Oliva & Torralba,2006). Cette représentation cognitive est supposée catégoriser rapidement la scène (par exemple dans le cas d'une scène naturelle, le fait qu'il s'agisse d'une cui-sine ou d'un animal) et percevoir l'agencement spatial des objets qui la composent. À partir de cette représentation un schéma de parcours de tous les éléments est généré.

2.4 Processus sémantique