• Aucun résultat trouvé

1. La perception visuelle de scènes complexes

1.1. Le guidage de l’attention visuelle

Lors de l’exploration de scènes visuelles statiques, l’attention de l’observateur ne se déplace pas de manière aléatoire. Deux types de guidage attentionnel coexistent (Henderson, 2007). Le guidage « ascendant », plutôt réactif, est régi par les propriétés visuelles (dites « caractéristiques de bas

niveau ») de la scène perçue. Par exemple, les endroits visuellement saillants (par leur luminosité, leur couleur, etc.) ou les frontières entre les différents éléments présents dans la scène attirent l’attention (Itti & Koch, 2000 ; Tatler, Hayhoe, Land, & Ballard, 2011). Le guidage « descendant » dépend quant à lui des buts et des connaissances de chaque individu, qui impliquent notamment la

mémoire à court-terme et la mémoire épisodique (Folk, Remington, & Johnston, 1992). Généralement, ces deux modes de guidage sont activés simultanément et interagissent pendant la perception d’une scène (Torralba, Oliva, Castelhano, & Henderson, 2006).

Une des théories les plus utilisées pour expliquer le fonctionnement de l’attention visuelle dans ces

de modéliser le guidage de l’attention lors de la perception d’une scène visuelle. Elle suppose que

l’attention de l’observateur est guidée en deux étapes. Dans la première étape dite « pré-attentive », toutes les informations de la scène sont traitées simultanément. Les caractéristiques de bas-niveau sont utilisées pour décomposer tous les objets de la scène en leurs traits visuels distinctifs. Cette

première étape permet de préparer le déploiement de l’attention à l’étape suivante. Dans la seconde étape, plus sélective, l’attention est portée de manière séquentielle aux différents objets de la scène. L’attention est guidée d’une part de manière ascendante à partir des éléments extraits à l’étape précédente, et d’autre part de manière descendante en fonction des buts et connaissances de

l’observateur. Ce modèle a été repris et adapté par Wolfe et ses collaborateurs dans le modèle de « recherche guidée » (Wolfe, 1994, 2003 ; Wolfe, Cave, & Franzel, 1989). Contrairement au modèle de Treisman et Gelade (1980), ce modèle suggère que le traitement des objets est à la fois séquentiel

et parallèle dans la phase d’attention sélective. Les objets s’engagent un par un dans le traitement attentionnel, mais plusieurs objets peuvent être traités simultanément une fois leur traitement entamé. Les deux types de guidage (ascendant et descendant) sont détaillés dans les paragraphes qui suivent.

1.1.1. Guidage ascendant

Les propriétés visuelles de bas niveau qui guident l’attention incluent principalement la couleur, le contraste, la luminance, mais également le mouvement dans les scènes visuelles dynamiques (Itti,

2005 ; Le Meur, Le Callet, & Barba, 2007). Les travaux ont permis d’élaborer des modèles computationnels de prédiction des déplacements de l’attention. Le Meur et al. ont proposé un modèle spatio-temporel de déploiement de l’attention visuelle basé sur les caractéristiques visuelles de bas niveau de scènes visuelles dynamiques. Ce modèle est fondé sur une décomposition de

l’image en plusieurs cartes de saillance spatiales. Chacune correspond à une propriété des objets telle que la couleur, la luminance, le contraste ou les fréquences spatiales. Une carte supplémentaire, celle du mouvement, est basée sur la décomposition temporelle de la séquence

d’images qui forment une animation décrite, pour chaque image, par un vecteur de mouvement

général et des vecteurs de mouvement local. Ce modèle prédit que lors de l’exploration libre d’une scène, le guidage attentionnel est fortement influencé par les caractéristiques de bas niveau de la scène. La confrontation avec les données expérimentales (visionnage libre de clips vidéo) a montré

que le modèle était fortement prédictif. Dans le cas d’une scène statique, le guidage ascendant est maximal juste après la présentation de la scène, mais diminue ensuite au cours du temps. Par contre, dans le cas d’une scène en mouvement, le guidage reste majoritairement ascendant tout au long de l’observation. Dans le cadre de ce modèle en effet, le guidage de l’attention visuelle est avant tout

prédit par les mouvements des différents objets de la scène.

1.1.2. Guidage descendant

L’activité de jeu implique aussi une exploration de l’environnement visuel guidée par des intentions,

liées principalement au but du jeu (Bernhard, Stavrakis, & Wimmer, 2010). Les joueurs ne se trouvent que rarement en situation de simple exploration de la scène. Toutefois, certains jeux (e.g., jeux de course, jeux musicaux) contraignent l’activité du joueur dans le temps. Dans ce cas le joueur n’a pas le choix du rythme de son activité. Lorsqu’un rythme rapide est imposé par le jeu, le guidage

de l’attention visuelle peut être géré uniquement de manière réactive.

Plusieurs auteurs ont observé et modélisé les déplacements de l’attention dans les scènes visuelles des jeux vidéo en fonction des propriétés de la scène, mais également des intentions du joueur

(Bernhard et al., 2010 ; Peters & Itti, 2008). Peters et Itti ont montré que la prise en compte des caractéristiques visuelles de la scène dans un jeu vidéo aidait à prédire l’orientation de l’attention, et donc du regard. Cependant, les résultats dépendaient du type de jeu utilisé. Dans un jeu vidéo qui nécessite de l’exploration visuelle (e.g., un jeu d’aventure), où l’attention du joueur est libre, les

propriétés de la scène visuelle sont prédominantes. Dans un jeu vidéo où l’attention est contrainte par le temps (e.g., un jeu de course), la prédiction par les caractéristiques visuelles de la scène est plus difficile. De plus, Bernhard et al. (2010) ont montré que dans un jeu de tir en vision subjective, la

prédiction du déplacement de l’attention était biaisée à cause de la présence fréquente d’un réticule

de visée au centre de l’écran. Cet élément, pas nécessairement très saillant, est utilisé pour réaliser les tâches qui imposent de viser et de tirer sur des cibles.

Ces différentes études ont montré qu’il était difficile de généraliser le comportement de l’attention