• Aucun résultat trouvé

Partage attentionnel lors de l’interaction avec des environnements dynamiques complexes

2. Les jeux vidéo comme environnements dynamiques complexes

2.2. Partage attentionnel lors de l’interaction avec des environnements dynamiques complexes

2.2.1. L’attention dans des situations multitâches

L’attention est une fonction cognitive qui permet de percevoir et traiter spécifiquement une ou plusieurs informations présentes parmi une multitude d’autres. Classiquement, un modèle simple

d’attention se compose de 2 éléments (Wickens & McCarley, 2008). Un filtre permet de sélectionner les informations présentes dans l’environnement qui sont utiles à la tâche. Puis un « réservoir » unique attribue à chaque information les ressources nécessaires pour son traitement (sa perception,

son intégration, et la réponse qu’elle provoque éventuellement). Toutes les tâches que le joueur doit exécuter requièrent des ressources attentionnelles. Lors d’une activité multitâche, l’accumulation des demandes attentionnelles peut générer des conflits dans l’allocation de ces ressources, et par

conséquent détériorer la performance du joueur. Les modèles de l’attention prennent généralement en compte un réservoir unique de ressources qui peut être partagé de manière flexible entre les différentes modalités des informations et les différents processus.

Selon les modèles de ressources attentionnelles les plus anciens (e.g., Broadbent, 1958), le

traitement de l’information s’effectue de manière sérielle à travers un canal mental unique. Le concept de goulot d’étranglement était alors utilisé pour expliquer les baisses de performance d’un opérateur dans une situation de double-tâche. Le concept de traitement parallèle des informations a été ensuite défini à partir d’un modèle de ressources limitées qui supposait un réservoir de

ressources unique, mais faisait aussi intervenir un processeur central qui affectait à chaque demande une partie des ressources disponibles en fonction de sa difficulté (e.g., Kahneman, 1973). Toutefois, ces modèles étaient insuffisants pour rendre compte des résultats qui montraient une variabilité des

interférences entre tâches selon leur nature, mais indépendamment de leur difficulté. Ces modèles restaient donc limités pour expliquer et prédire les interférences entre tâches dans des

environnements multitâches. Le modèle des ressources multiples proposé par Wickens (1984, 2002,

2008) offre un meilleur cadre pour expliquer et prédire la manière dont les ressources attentionnelles sont allouées lorsque plusieurs tâches doivent être réalisées simultanément par un opérateur. Wickens a proposé qu’un processeur central puisse partager les ressources

attentionnelles (limitées) en fonction à la fois des caractéristiques qualitatives des tâches engagées et de leur difficulté.

2.2.2. La théorie des ressources multiples

Le modèle des ressources multiples de Wickens (1984, 2002, 2008) suppose que quatre dimensions

dichotomiques catégorisent les ressources attentionnelles nécessaires à une tâche (voir figure 2 pour une représentation graphique). Selon les tâches, l’attention mobilise un seul des deux types de ressources de chaque dimension. Deux tâches qui font appel aux mêmes types de ressources d’une

dimension donnée interférent entre elles plus que deux tâches qui font appel aux deux types différents de ressources de cette dimension. Chacune des quatre dimensions est liée à des substrats neurophysiologiques précis, et a été validée par des études expérimentales. Ces dimensions correspondent par ailleurs à divers choix de conception possibles pour les environnements

multimodaux (Wickens & McCarley, 2008).

Dans une première dimension, les demandes attentionnelles sont caractérisées par le niveau de traitement que nécessite la tâche (Isreal, Chesney, Wickens, & Donchin, 1980). Le premier niveau de

traitement inclut l’encodage (perception) et le traitement central (cognition) de l’information, tandis que le second est celui de l’action de l’opérateur humain (réponse). Si une tâche requiert la perception d’une information et une autre concurrente un traitement central, par exemple en mémoire de travail, elles vont probablement interférer. De même, une interférence forte est

attendue si les ressources attentionnelles doivent être partagées entre la sélection d’une réponse et l’exécution d’une autre. Au contraire, une tâche perceptive interfère de manière plus faible avec une tâche motrice concurrente, et les deux tâches se réalisent ensemble plus facilement.

Figure 2. Représentation graphique (adaptée de l’anglais) des quatre dimensions de la théorie des ressources multiples selon Wickens (2002, 2008).

La deuxième dimension utilisée pour catégoriser les demandes attentionnelles des tâches est la modalité perceptive. Les modalités auditive et visuelle impliqueraient des ressources attentionnelles

distinctes, mais seulement dans le cadre de la perception. Cette dichotomie repose sur le fait qu’un partage de ressources intra-modal est plus difficile qu’un partage intermodal (Pierno, Caria, Glover, & Castiello, 2005 ; Wickens, Goh, Helleberg, Horrey, & Talleur, 2003). En effet, la proximité spatiale ou temporelle de deux sources d’informations visuelles ou auditives génère des effets de confusion ou

des effets de masquage chez l’opérateur (Wickens, Alexander, Ambinder, & Martens, 2004). Par ailleurs, le suivi simultané de deux sources visuelles éloignées augmente le coût de la tâche à cause de la charge supplémentaire liée au balayage visuel.

La troisième dimension des demandes attentionnelles se réfère à la distinction entre les codes de traitement spatial (analogique) et verbal (symbolique). Au niveau moteur, la distinction s’effectue entre les réponses manuelles qui sont généralement de nature plus spatiale, et les réponses vocales

qui utilisent souvent des ressources verbales. Par exemple, Wickens et Liu (1988) ont montré par une Spatial Verbal Focal Ambiant Auditif Visuel

Perception Cognition Réponse

Spatial Verbal Manuel Spatial Vocal Verbal

méthode de double tâche que la performance à une tâche spatiale continue (poursuite manuelle

d’une cible) est détériorée par une tâche secondaire de décision spatiale, mais pas par une tâche secondaire verbale.

La quatrième et dernière dimension a été introduite plus récemment (Wickens, 2002). Dans la

modalité visuelle, il semble que les traitements visuels focalisés et non focalisés (i.e., globaux, ou périphériques) utilisent des ressources différentes (Weinstein & Wickens, 1992). Les ressources du « canal focal », qui implique surtout la vision fovéale, sont allouées aux tâches attentionnelles les plus fines telles que la reconnaissance d’objets. Les ressources du « canal ambiant », qui implique

surtout la vision périphérique, sont utilisées pour des tâches plus générales telles que la perception du déplacement de soi et de l’orientation, ou pour détecter des changements dans le champ visuel périphérique.

Les ressources attentionnelles nécessaires pour une tâche peuvent être caractérisées selon chacune de ces quatre dimensions. Dans des situations multitâches, plus les tâches utilisent des ressources de niveaux communs dans une ou plusieurs dimensions, plus le partage de ces ressources provoque des interférences. A l’inverse, il y a moins d’interférences entre les demandes attentionnelles qui

exploitent des ressources de niveaux distincts dans chaque dimension. Par conséquent, le modèle peut prédire l’intensité des interférences entre des tâches réalisées simultanément lors d’une activité impliquant des environnements dynamiques complexes.

Deux exemples d’application du modèle de Wickens ont été présentés par Wickens et al. (2003) et Horrey, Wickens, et Consalus (2006). Dans la première étude (Wickens et al., 2003), un appareil d’aide à la navigation d’un avion présentait des informations de manière verbale auditive et/ou

visuelle à un pilote pendant qu’il dirigeait son avion. Les détections de cibles et le suivi du trajet étaient meilleurs lorsque la modalité auditive seule était utilisée par rapport à quand la modalité visuelle seule, ou combinée avec la modalité auditive, était utilisée. Un problème de mémorisation survenait tout de même si le message présenté était trop long. Dans la deuxième étude (Horrey et

al., 2006), l’interférence visuelle entre l’activité de conduite automobile et le suivi d’informations

visuelles sur un écran embarqué a également été démontrée. Plus l’information à traiter sur l’écran embarqué était importante, plus le suivi du trajet et la détection de cibles étaient défaillants. Les auteurs ont néanmoins supposé que la vision périphérique pouvait être une aide non-négligeable à la

détection de cibles lorsque l’attention était posée sur l’écran embarqué.

Dans une activité multitâche, l’attention de l’opérateur doit être partagée. Cependant le partage de l’attention est aussi nécessaire lors de l’utilisation de plusieurs sources d’information pour une même tâche.

2.2.3. Intégration de plusieurs sources d’information

Jouer à un jeu vidéo requiert la réalisation simultanée de plusieurs tâches (Ang, Zaphiris, & Mahmood, 2007), pour lesquelles le joueur doit partager son attention entre les différentes sources

d’information auditives ou visuelles disponibles, acquérir les informations nécessaires et les intégrer. Plusieurs études qui se sont intéressées à la conception optimale des interfaces multimodales complexes suggèrent qu’il faudrait minimiser le coût d’intégration des informations (Wickens & McCarley, 2008). Les interfaces devraient faciliter la combinaison mentale des informations issues de

sources séparées, en particulier quand l’attention doit être partagée entre ces sources.

Principe de proximité-compatibilité. Le principe de proximité-compatibilité peut être utilisé pour

expliquer et optimiser l’intégration d’informations. Wickens et Carswell (1995) ont démontré que

deux sources d’information qui requièrent de l’attention partagée devaient être placées à proximité l’une de l’autre dans l’interface pour être intégrées en vue d’une tâche ou d’une opération mentale commune. A l’inverse, les informations utilisées en attention focalisée (de manière isolée) doivent être éloignées les unes des autres. En effet, maximiser la proximité spatiale et/ou temporelle de deux

informations réduit l’amplitude des mouvements attentionnels nécessaires dans les situations d’attention partagée. Renshaw, Finlay, Tyfa, et Ward (2004) ont étudié une tâche de recherche

d’information dans un graphique qui requérait l’intégration de sources multiples d’informations. Ils

ont montré que les participants répondaient plus rapidement quand les sources d’informations, telles que les noms des courbes et les données numériques, étaient disposées à l’intérieur du graphique plutôt qu’à l’extérieur comme légendes.

Cependant, une forte proximité spatiale entre les signaux visuels ne permet pas toujours une meilleure intégration des informations. Premièrement, la proximité peut conduire à la confusion et au masquage, par exemple quand un affichage tête-haute est superposé à la scène principale. Ceci peut avoir un effet négatif ou réduire le bénéfice pour la performance de l’opérateur (Wickens et al.,

2004). Deuxièmement, le continuum du principe de proximité-compatibilité indique que moins des sources d’information sont utilisées simultanément dans une même tâche, plus leur proximité spatiale peut conduire à des interférences (Wickens & Carswell, 1995). Elles doivent donc être tenues

plus éloignées les unes des autres. Dans les cas les plus extrêmes, le continuum s’étend à des tâches où une intégration complète des différentes informations est nécessaire, et au contraire à d’autres où les sources d’information ne sont jamais utilisées simultanément. Entre ces deux extrêmes, il existe des cas où seules quelques caractéristiques des deux informations doivent être combinées, et

d’autres où les deux informations doivent être utilisées simultanément, mais sans être ni combinées, ni intégrées.

Lors de l’intégration d’informations, une des sources peut fournir l’information de manière

dynamique. Dans ce cas, des mécanismes d’anticipation peuvent également être mis en jeu.

Anticipation visuelle des informations dans les jeux vidéo. Dans les jeux vidéo, anticiper l’apparition

ou la modification des informations apparait essentiel. Les objets visuels impliqués dans l’action et

visibles à l’arrière-plan de la scène sont généralement en mouvement. De plus, les informations données par les affichages tête-haute sont souvent modifiées en temps réel. La performance du joueur est optimale lorsqu’il anticipe le plus possible les mouvements et qu’il réussit à détecter les modifications d’information le plus rapidement possible.

Quand l’arrière-plan de la scène se déplace dans une direction, par exemple vers le haut, pour

donner l’illusion d’un déplacement de soi, le joueur doit continuellement porter son attention sur les nouvelles informations qui apparaissent en bas de l’écran. Il doit détecter aussi vite que possible des obstacles potentiels, des alliés ou des ennemis. Dans le même temps, il doit continuer à exécuter la

tâche principale et regarder (ou écouter) les informations données par le système.

Bien que l’anticipation visuelle des joueurs de jeu vidéo n’ait pas été empiriquement étudiée, des situations similaires sont souvent rencontrées par des opérateurs humains dans d’autres environnements virtuels ou réels. Les meilleurs exemples sont actuellement le pilotage d’avions ou la

conduite automobile. Conducteurs et pilotes doivent porter leur attention à de multiples sources d’information tout en anticipant ce qui peut arriver en avant de leur engin ou véhicule, vers où ils se dirigent. Les enregistrements des mouvements oculaires ont été utilisés pour observer les

mouvements du regard et évaluer le degré d’anticipation des opérateurs (Owsley & McGwin Jr, 2010 ; Underwood, 2007 ; Underwood, Chapman, Brocklehurst, Underwood, & Crundall, 2003 ; Wickens et al., 2003). Underwood et al. ont étudié les mouvements oculaires de conducteurs novices et experts. Dans des situations de conduite naturelle, les conducteurs experts accordaient plus

d’attention aux régions les plus lointaines de la route qu’aux autres zones de l’environnement visuel. Cette stratégie reflète le fait qu’ils passent la majorité de leur temps à anticiper de possibles accidents. Par contre, les conducteurs novices utilisaient moins souvent ce type de stratégie. Ces

résultats suggèrent qu’une plus grande part des ressources attentionnelles est dévolue à l’anticipation quand la conduite devient plus automatique.