• Aucun résultat trouvé

Etude comportementale et électrophysiologique de la capture attentionnelle cross-modale par la menace

N/A
N/A
Protected

Academic year: 2022

Partager "Etude comportementale et électrophysiologique de la capture attentionnelle cross-modale par la menace"

Copied!
83
0
0

Texte intégral

(1)

Master

Reference

Etude comportementale et électrophysiologique de la capture attentionnelle cross-modale par la menace

HUYNH CONG, Stanislas

Abstract

La saillance d'un événement non-pertinent pour la tâche peut déclencher des déplacements attentionnels spatiaux, automatiques et involontaires, qui entravent le traitement d'une cible pertinente. Ce phénomène de capture attentionnelle se manifeste en modalité visuelle, en modalité auditive et de manière cross-modale, en raison d'un mécanisme de contrôle supramodal du déplacement attentionnel. De manière similaire aux propriétés physiques, il a été démontré que le caractère menaçant des stimuli provoquait aussi des biais attentionnels, au niveau visuel (i.e. visages de colère) et auditif (i.e. prosodies de colère), en raison de son importance pour la survie. Un tel système de détection de la menace permettrait donc un traitement attentionnel automatique de certains stimuli, même lorsqu'ils ne sont pas pertinents pour la tâche. Afin de déterminer si c'était le cas avec des prosodies de colère, nous avons créé une tâche cross-modale où elles étaient présentées durant la recherche visuelle d'un visage neutre. Nos résultats ne révèlent aucune interférence significative des prosodies de [...]

HUYNH CONG, Stanislas. Etude comportementale et électrophysiologique de la capture attentionnelle cross-modale par la menace. Master : Univ. Genève, 2019

Available at:

http://archive-ouverte.unige.ch/unige:124247

Disclaimer: layout of this document may differ from the published version.

1 / 1

(2)

ETUDE COMPORTEMENTALE ET ÉLECTROPHYSIOLOGIQUE DE LA CAPTURE ATTENTIONNELLE CROSS-MODALE PAR LA MENACE

MÉMOIRE RÉALISÉ EN VUE DE L’OBTENTION DE LA MAITRISE UNIVERSITAIRE EN PSYCHOLOGIE

ORIENTATIONS

PSYCHOLOGIE CLINIQUE INTEGRATIVE PSYCHOLOGIE COGNITIVE

PAR

Stanislas Huynh Cong (14-422-661)

DIRECTEURS DU MÉMOIRE

Dirk Kerzel (Prof.) et Nicolas Burra (PhD) JURY

Dirk Kerzel (Prof.) Nicolas Burra (PhD) Radek Ptak (Prof.)

Genève, Juin 2019

UNIVERSITÉ DE GENÈVE FACULTÉ DE PSYCHOLOGIE ET DES SCIENCES DE L’ÉDUCATION

SECTION DE PSYCHOLOGIE

(3)
(4)

Je tiens à remercier toutes les personnes qui m’ont soutenu et suivi, de près ou de loin, dans la réalisation de ce travail, et plus généralement, au fil de ces deux années de Master. Pour commencer, Nicolas Burra qui a été un superviseur exceptionnel durant toute cette période.

Grâce à ton expertise, ta bienveillance et ta disponibilité, tu m’as guidé dans l’assimilation de nombreuses connaissances théoriques et méthodologiques mais aussi dans l’acquisition d’innombrables compétences pratiques. En effet, j’ai été formé par tes soins à l’élaboration et la conduite d’une expérience en électroencéphalographie mais aussi à l’analyse des données qui en résultaient. De plus, tu as toujours été présent pour répondre à mes questions et pour orienter ma réflexion grâce à tes conseils et suggestions de qualité. J’ai eu beaucoup de plaisir à collaborer avec toi sur ce projet et j’espère de tout cœur que nous aurons à nouveau l’occasion de travailler ensemble par la suite !

Toute ma gratitude va également au Professeur Kerzel qui m’a accueilli et intégré au sein de son équipe, qui m’a accordé sa confiance (notamment au cours de mon travail d’auxiliaire de recherche et d’enseignement) et qui a veillé à ce que nous puissions disposer des ressources nécessaires au bon déroulement de cette étude. Mes remerciements vont également au Professeur Ptak qui a accepté de faire partie de mon juré et ce faisant, de se rendre disponible pour l’évaluation et la lecture critique de ce travail.

Un grand merci aussi à tous mes amis et collègues de l’Université pour leur présence qui a largement contribué à rendre mes journées moins longues et la rédaction de ce Mémoire plus agréable ! Je tiens également à remercier tous les participants qui ont gentiment accepté de passer cette expérience malgré sa grande durée.

Pour finir, une pensée toute particulière va à mes grands-parents qui m’ont toujours soutenu et encouragé, tant dans la réalisation de ce travail que dans les différents projets que j’entreprends. Un immense merci pour votre présence, votre patience et votre confiance au fil de ces années universitaires, que je suis extrêmement heureux d’avoir pu partager avec vous.

(5)
(6)

La saillance d’un événement non-pertinent pour la tâche peut déclencher des déplacements attentionnels spatiaux, automatiques et involontaires, qui entravent le traitement d’une cible pertinente. Ce phénomène de capture attentionnelle se manifeste en modalité visuelle, en modalité auditive et de manière cross-modale, en raison d’un mécanisme de contrôle supramodal du déplacement attentionnel. De manière similaire aux propriétés physiques, il a été démontré que le caractère menaçant des stimuli provoquait aussi des biais attentionnels, au niveau visuel (i.e. visages de colère) et auditif (i.e. prosodies de colère), en raison de son importance pour la survie. Un tel système de détection de la menace permettrait donc un traitement attentionnel automatique de certains stimuli, même lorsqu’ils ne sont pas pertinents pour la tâche. Afin de déterminer si c’était le cas avec des prosodies de colère, nous avons créé une tâche cross-modale où elles étaient présentées durant la recherche visuelle d’un visage neutre. Nos résultats ne révèlent aucune interférence significative des prosodies de colère sur la sélection attentionnelle de la cible, autant au niveau comportemental qu’électrophysiologique (N2pc). En revanche, elles accélèrent et améliorent le traitement de la cible selon leur position spatiale. Nous expliquons ces observations par une interaction entre des processus non-spécifiques d’alerte phasique et de sélection attentionnelle dans l’espace.

(7)
(8)

Déclaration sur l’honneur

Je déclare que les conditions de réalisation de ce travail de mémoire respectent la charte d’éthique et de déontologie de l’Université de Genève. Je suis bien l’auteur de ce texte et atteste que toute affirmation qu’il contient et qui n’est pas le fruit de ma réflexion personnelle est attribuée à sa source ; tout passage recopié d’une autre source est en outre placé entre guillemets.

Genève, Juin 2019

Stanislas Huynh Cong

Signature

(9)
(10)

1 Introduction théorique ... 11

1.1 Attention sélective en modalité visuelle ... 11

1.1.1 Orientation attentionnelle ouverte et couverte ... 11

1.1.2 Sélection attentionnelle « top-down » et « bottom-up »... 12

1.1.3 Capture attentionnelle et « Additional Singleton Paradigm » ... 13

1.2 Attention sélective en modalité auditive ... 15

1.2.1 Sélection attentionnelle « top-down » en modalité auditive ... 15

1.2.2 Capture attentionnelle en modalité auditive ... 16

1.3 Déplacement cross-modal de l’attention ... 17

1.3.1 Aspects endogènes... 18

1.3.2 Aspects exogènes... 19

1.4 Mécanisme(s) attentionnel(s) supramodal ou séparés, mais liés ? ... 21

1.5 Electroencéphalographie et potentiels évoqués cérébraux ... 23

1.5.1 Marqueurs électrophysiologiques de l’attention visuelle : N2pc et PD ... 23

1.5.2 Marqueurs électrophysiologiques de l’attention auditive : N2ac et LPCpc... 26

1.6 Hypothèse de la capture attentionnelle par la menace ... 27

1.6.1 Menaces visuelles : visages de colère ... 28

1.6.2 Menaces auditives : prosodies de colère ... 32

1.6.3 Effet cross-modal de la menace ... 33

1.7 Objectifs et hypothèses de la recherche ... 35

1.7.1 Objectifs ... 35

1.7.2 Hypothèses ... 36

1.7.2.1 Hypothèses comportementales ... 36

1.7.2.2 Hypothèses électrophysiologiques ... 38

2 Méthode ... 40

2.1 Participants ... 40

2.2 Stimuli ... 40

2.3 Procédure ... 41

2.4 Enregistrement et analyse comportementale : temps de réaction et précision ... 43

2.5 Enregistrement et analyse électrophysiologique : N2pc ... 44

3 Résultats ... 46

3.1 Résultats comportementaux : temps de réaction et précision ... 46

3.2 Résultats électrophysiologiques : N2pc ... 49

3.2.1 Résultats complémentaires : Ppc ... 50

(11)

4.1 Résultats comportementaux : temps de réaction et précision ... 54

4.2 Résultats électrophysiologiques : N2pc ... 57

4.2.1 Résultats complémentaires : Ppc ... 58

4.3 Implication pour l’hypothèse de la capture attentionnelle par la menace ... 59

4.4 Limites ... 60

4.4.1 Stimuli ... 60

4.4.2 Paradigme expérimental ... 61

4.4.3 N2pc ... 62

4.5 Perspectives futures ... 62

4.5.1 Capture attentionnelle en modalité auditive et cross-modale ... 62

4.5.2 Arousal-Biaised Competition ... 64

5 Bibliographie ... 66

6 Annexes ... 78

6.1 Annexe I : Résultats comportementaux ... 78

6.1.1 Temps de réaction... 78

6.1.2 Précision ... 79

6.2 Annexe II : Résultats électrophysiologiques ... 80

6.2.1 N2pc (250 à 290 ms) ... 80

6.2.2 Ppc (140 à 180 ms) ... 81

(12)

11 1 Introduction théorique

1.1 Attention sélective en modalité visuelle

Les situations de vie quotidienne impliquent la confrontation simultanée à d’innombrables informations visuelles à traiter afin de guider efficacement nos comportements.

Toutefois, en raison des capacités limitées de nos systèmes cérébraux, le traitement de multiples sensations en compétition nécessite l’intervention d’un processus cognitif médiateur supplémentaire (Desimone & Duncan, 1995 ; Kastner & Ungerleider, 2001). En allouant sélectivement des ressources de traitement à certaines caractéristiques visuelles ou à certains emplacements spatiaux, l’attention visuelle permet de sélectionner les éléments importants à analyser, tout en ignorant ceux qui ne sont pas pertinents (Klein & Lawrence, 2012). Pour prendre des décisions, l’information disponible dans l’environnement passerait alors à travers un « filtre » (Broadbent, 1958) afin qu’il soit possible de se focaliser sur certains aspects d’une scène visuelle au détriment des autres. De manière étonnante, cette conception contemporaine et fonctionnelle de l’attention visuelle reflète fidèlement une des premières définitions données à ce mécanisme cognitif par William James en 1890 :

” [Attention] is the taking possession by the mind, in clear and vivid form, of one out of what seem several simultaneously possible objects or trains of thought […]. It implies withdrawal from some things in order to deal effectively with others” (pp. 403-404).

1.1.1 Orientation attentionnelle ouverte et couverte

On distingue classiquement deux types d’orientation de l’attention dans l’espace qui ont été détaillés initialement par Posner (1980). L’attention ouverte représente le déplacement de la tête et plus particulièrement des yeux par saccades vers les éléments d’intérêt, ce qui permet de les placer dans la région d’acuité visuelle maximale, c’est-à-dire la fovéa (Deubel &

Schneider, 1996). Parallèlement, le déplacement de l’attention, notamment dans les régions périphériques du champ visuel (Bisley, 2011), peut s’effectuer de manière couverte, c’est-à- dire sans aucun mouvement oculaire et donc uniquement grâce à des mécanismes centraux.

L’orientation de l’attention a été étudiée expérimentalement par Posner (1980) grâce à un paradigme d’indiçage visuo-spatial qui porte désormais son nom. En maintenant le regard sur une croix de fixation, les sujets sont plus rapides pour détecter l’apparition d’une cible périphérique si, auparavant, un indice a indiqué son emplacement correct (condition valide) et sont plus lents s’il a indiqué une autre position (condition non-valide). La différence de temps de réaction entre ces deux conditions représente le temps nécessaire pour que le sujet déplace son foyer attentionnel de l’emplacement erroné à celui de la cible. Ces résultats classiques

(13)

12

mettent ainsi en évidence que la réorientation de l’attention prend un certain temps et qu’elle peut s’effectuer vers différentes parties du champ visuel, indépendamment des mouvements oculaires.

1.1.2 Sélection attentionnelle « top-down » et « bottom-up »

Ces deux types d’orientation de l’attention dans l’espace peuvent résulter d’un mécanisme de sélection attentionnelle volontaire – « top-down » ou automatique – « bottom- up » (Jonides, 1981). La sélection « top-down » représente une allocation intentionnelle et contrôlée de l’attention qui est alors guidée par les attentes, les connaissances et les buts de l’individu vers les éléments pertinents (Folk, Remington & Johnston, 1992). A l’inverse, la sélection « bottom-up » est sous contrôle des propriétés physiques des stimuli de l’environnement comme leur saillance, c’est-à-dire qu’elle est attirée de manière automatique et involontaire à leur emplacement (Theeuwes, 2010 ; Yantis & Jonides, 1984). Dans cette optique, la saillance dépend de la similarité entre la cible et les non-cibles ainsi que de l’homogénéité de ces dernières, c’est-à-dire qu’une cible sera saillante si elle diffère des non- cibles sur au moins une dimension et que les non-cibles constituent un fond homogène sur cette même dimension (Duncan & Humphrey, 1989).

Pour étudier cette distinction, le paradigme de Posner (1980) mentionné précédemment propose d’utiliser deux types d’indices (Figure 1). Les indices endogènes (comme une flèche) sont centraux, interprétables et prédisent la majeure partie du temps l’emplacement correct d’apparition de la future cible, ce qui permet sa sélection attentionnelle « top-down ». A l’inverse, les indices exogènes (comme un flash) sont périphériques et apparaissent momentanément à un emplacement de l’espace sans prédire la position de la cible subséquente, ce qui est censé attirer l’attention de manière automatique et « bottom-up ». Quel que soit le type d’indice, l’orientation de l’attention se traduit par des temps de réaction diminués ou augmentés si l’indiçage est respectivement correct (condition valide) ou incorrect (condition non-valide). En revanche, un phénomène spécifique aux situations d’indiçage exogène a été observé sous la forme d’un pattern biphasique. Rapidement après avoir été attirée automatiquement vers un emplacement, l’attention permet une meilleure détection et discrimination des stimuli qui s’y trouvent, mais si le délai entre l’indice et la cible augmente, la performance diminue. Ce phénomène appelé « inhibition de retour » permettrait d’optimiser la recherche visuelle dans l’espace (Posner & Cohen, 1984).

(14)

13

Figure 1. Paradigme de Posner (1980) avec un indiçage endogène (« Central ») et exogène (« Peripheral ») pouvant être valide ou invalide. Tiré de Chica, Bartolomeo et Lupiáñez (2013).

1.1.3 Capture attentionnelle et « Additional Singleton Paradigm »

Ces deux mécanismes de sélection attentionnelle ayant été mis à jour, plusieurs hypothèses ont été formulées quant à leur importance relative et leur dynamique temporelle.

Ainsi, l’hypothèse de la capture contingente suggère que la sélection attentionnelle dépend toujours et à tout moment des buts comportementaux explicites ou implicites du sujet, c’est-à- dire d’un traitement « top-down » (Folk et al., 1992 ; Folk, Remington & Wright, 1994). Selon ces auteurs, le sujet adopterait un « set attentionnel », c’est-à-dire qu’il se mettrait dans un état de préparation (en fonction de ses attentes) qui faciliterait le traitement d’un certain item durant la réalisation de la tâche à venir. En adoptant un point de vue plus nuancé, d’autres auteurs ont proposé que la sélection attentionnelle « top-down » concernerait certaines dimensions physiques précises des items (comme la couleur) alors que la sélection « bottom-up » serait déclenchée uniquement lorsqu’un nouvel item apparait brusquement dans le champ visuel (Jonides & Yantis, 1988 ; Yantis & Jonides, 1984). Alternativement, il a été proposé que les deux mécanismes agissent en parallèle à travers l’attribution « top-down » d’un poids attentionnel à certaines dimensions visuelles afin de moduler la saillance du distracteur et de la cible, ce qui augmenterait la probabilité que cette dernière soit sélectionnée (Found & Müller, 1996 ; Müller, Reimann & Krummenacher, 2003). Enfin, pour Theeuwes (1991, 1992), la sélection attentionnelle initiale serait complètement déterminée par les propriétés physiques des stimuli et seulement ensuite, le contrôle volontaire du sujet pourrait moduler cette sélection via des boucles de rétroaction (Lamme & Roelfsema, 2000 ; VanRullen & Koch, 2003).

(15)

14

Pour conceptualiser cette dernière hypothèse, la notion de capture attentionnelle a été développée. Elle se définit comme un type de sélection attentionnelle « bottom-up » dans laquelle une priorité de traitement est donnée automatiquement à des événements non- pertinents, mais qui ont des caractéristiques suffisamment saillantes et ce, indépendamment des buts et intentions volontaires en cours (Theeuwes, 2010). Afin de tester expérimentalement ce postulat théorique, Theeuwes (1991, 1992) a développé un paradigme de recherche visuelle nommé « additional singleton paradigm » (Figure 2). Dans celui-ci, les sujets doivent d’abord fixer une croix centrale entourée d’un nombre variable de formes géométriques qui contiennent chacune un segment de ligne orienté horizontalement ou verticalement. Dans la condition neutre, un seul de ces items diffère des autres sur la dimension de la forme (p. ex. un losange vert parmi des cercles verts) et les sujets doivent discriminer l’orientation de la ligne qu’il contient en appuyant sur la touche correspondante. Dans la condition critique, un autre item que la cible diffère également de ses voisins, mais sur la dimension non-pertinente de la couleur (p.

ex. un cercle rouge à la place d’un des cercles verts), ce qui en fait un distracteur saillant. Les résultats indiquent que les temps de réaction pour discriminer l’orientation du segment de ligne contenu dans la cible sont considérablement augmentés dans cette deuxième condition en comparaison avec la première. Theeuwes (1991, 1992) interprète cette observation comme étant le temps nécessaire pour désengager son attention de l’emplacement du distracteur et pour la réallouer à celui de la cible, ce qui requiert plus ou moins d’effort selon leur degré de similitude.

Ainsi, le distracteur saillant sur une dimension non-pertinente (comme la couleur) capturerait l’attention même si le sujet sait préalablement qu’il sera présent à chaque essai et que la cible diffère de ses voisins sur une dimension précise (comme la forme). Ceci suggère que les processus de sélection attentionnelle « bottom-up » sont prioritaires par rapport au processus

« top-down » dans une phase initiale du traitement attentionnel visuel (Theeuwes, 2010).

Figure 2. « Additional singleton paradigm » de Theeuwes (1991, 1992) avec une condition neutre (gauche) et une condition critique (droite) contenant un distracteur de couleur différente. Tiré de Theeuwes (2010).

(16)

15 1.2 Attention sélective en modalité auditive

Bien que les informations visuelles dominent notre expérience perceptuelle du monde et que les processus attentionnels soient centraux dans cette modalité, ils ne se limitent pas qu’à celle-ci. Ainsi, de manière analogue aux scènes visuelles, les environnements auditifs sont composés de nombreuses stimulations sonores dont seule une partie est pertinente pour le comportement, ce qui nécessite leur traitement sélectif (Fritz, Elhilali, David & Shamma, 2007

; Gamble & Luck, 2011 ; Hafter, Sarampalis & Loui, 2008). Il n’est donc pas étonnant que des mécanismes attentionnels communs aient été mis à jour en modalité visuelle et auditive, comme la distinction entre sélection « top-down » et « bottom-up ».

Toutefois, certaines caractéristiques anatomo-fonctionnelles propres au système auditif déterminent en partie la façon dont ces processus opèrent, notamment en ce qui concerne la localisation spatiale des événements et leur vitesse de détection (Ward, McDonald & Golestani, 1998). Ainsi, à l’inverse du système visuel qui encode une représentation spatiale (spatiotopie) du champ visuel dès le niveau périphérique, le système auditif encode une représentation fréquentielle (tonotopie) et temporelle du champ auditif, celle-ci permettant ensuite à différentes structures centrales de reconstruire l’information spatiale de manière moins précise (Eramudugolla, McAnally, Russell, Irvine, Mattingley, 2008). En revanche, en raison des différences de vitesse de traitement neuronal entre ces systèmes sensoriels, un stimulus auditif est détecté plus rapidement qu’un stimulus visuel (Keetels & Vroomen, 2012 ; Posner, 1978).

L’audition est alors libre des restrictions spatiales des autres sens pour détecter rapidement les changements de l’environnement, ce qui lui confère la fonction d’agir comme un système sensoriel d’alerte précoce, indépendamment de la position du corps (Scharf, 1998).

1.2.1 Sélection attentionnelle « top-down » en modalité auditive

En utilisant la technique de l’écoute dichotique, qui consiste à présenter simultanément des stimuli auditifs différents à chaque oreille d’un sujet, les études pionnières dans le domaine (p. ex. Broadbent, 1958 ; Moray, 1959 ; Treisman, 1969) ont étudié la capacité à suivre sélectivement une conversation dans une situation bruyante à plusieurs interlocuteurs. Le

« cocktail-party phenomenon » a ainsi été décrit initialement par Cherry (1953) en démontrant qu’il était possible de réaliser une sélection attentionnelle des phrases prononcées par une femme, tout en ignorant celles prononcées par un homme. Par la suite, l’utilisation de stimuli auditifs plus simples a permis de mettre en évidence que la détection et la discrimination étaient facilitées pour les sons dont la fréquence, l’intensité ou la durée était connue à l’avance. Ceci indique que l’attention auditive permet de se concentrer volontairement sur certaines

(17)

16

caractéristiques du son afin d’améliorer leur traitement, et ce, indépendamment de leur position spatiale (Dalton & Lavie, 2004). L’organisation tonotopique du système auditif explique pourquoi les caractéristiques sonores comme la fréquence peuvent bénéficier d’une priorité de traitement attentionnel par rapport à leur position dans l’espace (Eramudugolla et al., 2008).

Toutefois, malgré la moins bonne précision spatiale de l’attention auditive, il a été démontré que la connaissance de l’emplacement d’une source sonore améliorait le traitement des signaux auditifs qui en émanaient (Eramudugolla et al., 2008). En ce sens, Kidd, Arbogast, Mason et Gallun (2005) ont étudié le rôle de l’allocation de l’attention auditive dans l’espace en situation d’écoute incertaine. Les sujets devaient identifier des mots-clés prononcés par un locuteur-cible en présence de deux autres locuteurs dont les positions spatiales variaient d’essai en essai. Lorsque les mots à identifier étaient indicés avant l’essai, mais que l’emplacement du locuteur-cible était incertain, la performance d’identification était améliorée par rapport aux essais non-indicés. De manière plus intéressante, lorsque l’emplacement du locuteur-cible était connu avant l’essai, les performances d’identification étaient améliorées, et ce, indépendamment de l’indiçage des mots à identifier. Ces résultats indiquent que l’attention auditive permet de sélectionner intentionnellement une source sonore dans l’espace en présence de distracteurs, ce qui améliore l’identification de mots-clés qui en proviennent. Ainsi, malgré des différences de traitement de la localisation spatiale des événements entre la modalité visuelle et auditive, il existe des mécanismes de sélection attentionnelle « top-down » dans l’espace qui sont sensiblement similaires (Fritz et al., 2007).

1.2.2 Capture attentionnelle en modalité auditive

En modalité auditive, l’attention sélective peut donc être déplacée dans l’espace, ce qui permet de sélectionner volontairement les signaux sonores qui émanent d’une source sonore.

Toutefois, comme mentionné précédemment, elle permet également de traiter des caractéristiques sonores non-spatiales et serait donc soumise à la capture par des sons saillants, mais non-pertinents pour la tâche en cours, comme en modalité visuelle (Watkins, Dalton, Lavie

& Rees, 2006).

Alors que des déplacements exogènes de l’attention auditive ont été révélés par plusieurs études d’indiçage (McDonald & Ward, 1999 ; Spence & Driver, 1994), l’étude de Dalton et Lavie (2004) vise à établir l’existence d’un phénomène de capture attentionnelle auditive qui serait analogue à celui observé en modalité visuelle. En adaptant le « additional singleton paradigm » de Theeuwes (1991, 1992), ces auteurs ont élaboré une tâche de recherche auditive sérielle et rapide dans laquelle une caractéristique auditive cible (comme la fréquence)

(18)

17

était présentée temporellement parmi des non-cibles (de fréquence différente). Les sujets devaient détecter sa présence ou discriminer sa valeur (haute ou basse fréquence). Dans la moitié des essais, une des non-cibles pouvaient également posséder une caractéristique unique non-pertinente (comme une forte ou faible intensité). Les résultats indiquent des coûts de temps de réaction pour détecter ou discriminer la cible en présence d’un distracteur, et ce, indépendamment des caractéristiques sonores cibles étudiées (fréquence, intensité ou durée).

Ceci suggère qu’un son saillant peut capturer l’attention auditive même s’il est caractérisé par une caractéristique sonore non-pertinente pour la tâche en cours. Il s’agit alors d’un phénomène proche de celui observé dans le domaine visuel si on considère l’analogie entre la recherche visuelle spatiale et la recherche auditive temporelle, comme suggéré par Dalton et Lavie (2004).

La nature purement déterminée par le stimulus de ce phénomène a toutefois été questionnée par ces mêmes auteurs en suggérant que la capture ne se produisait que dans certaines situations spécifiques. Ainsi, Bacon et Egeth (1994) ont observé que la capture attentionnelle en modalité visuelle dépendait du mode de recherche adopté par le sujet. Si celui- ci recherche une cible en tant qu’élément singulier (« singleton detection mode »), un distracteur unique peut capturer l’attention alors que ce n’est pas le cas si le sujet recherche une caractéristique précise de la cible (« feature detection mode »). Sur cette base, l’étude de Dalton et Lavie (2007) vise à examiner dans quelle mesure la capture attentionnelle en modalité auditive dépend également de la stratégie de recherche adoptée par le participant. En modifiant leur précédent design expérimental, ces auteurs mettent en évidence que l’effet d’interférence du distracteur (défini par l’intensité) sur la recherche de la cible (définie par la fréquence) est éliminé lorsqu’un autre type de non-cible est ajouté (définie par une basse et haute fréquence) ou que plus d’une cible est présentée. De manière similaire aux observations faites par Bacon et Egeth (1994), ces manipulations induiraient un « feature detection mode » qui pousse le participant à rechercher une caractéristique précise de la cible (en termes de fréquence) et qui élimine la capture attentionnelle par le distracteur. Ainsi, autant en modalité visuelle qu’auditive, la capture attentionnelle peut être modulée par les exigences de la tâche.

1.3 Déplacement cross-modal de l’attention

Les mécanismes de sélection et de capture attentionnelle présentés jusqu’à présent ont longtemps été étudiés de manière isolée pour chaque modalité sensorielle (Driver & Spence, 1998 ; Spence & Driver, 1996). Toutefois, les environnements quotidiens dans lesquels nous évoluons sont multisensoriels et nécessitent la coordination entre des informations visuelles et auditives pouvant provenir du même emplacement spatial (Eimer & Driver, 2001). Ceci soulève

(19)

18

une question fondamentale sur la nature des mécanismes attentionnels impliqués : est-ce qu’un événement dans une modalité sensorielle peut déclencher un déplacement attentionnel qui affecte le traitement des stimuli dans une autre modalité sensorielle ?

La majorité des études comportementales qui ont étudié le déplacement cross-modal de l’attention l’ont fait à l’aide de paradigmes d’indiçage proches de celui de Posner (1980) utilisé pour étudier l’orientation couverte de l’attention. Dans ceux-ci, un indice dans une modalité sensorielle (p. ex. audition) est utilisé pour guider ou attirer l’attention à l’emplacement d’une cible à détecter ou à discriminer dans une autre modalité sensorielle (p. ex. vision), le caractère endogène ou exogène de ce déplacement étant déterminé par la nature de l’indice (Wright &

Ward, 2008). En ce sens, le paradigme de l’indiçage spatial orthogonal développé par Spence et Driver (1994) s’est révélé particulièrement intéressant pour étudier ces phénomènes (Figure 3). Dans celui-ci, les participants sont indicés de différentes façons vers le côté gauche ou droit de l’affichage et doivent ensuite, tout en fixant un point central, discriminer l’élévation (haut ou bas) de l’événement cible, indépendamment de son côté et de sa modalité.

L’emplacement latéral indicé est alors entièrement orthogonal à la discrimination qui doit être réalisée, ce qui élimine les potentiels biais de réponses gauche/droite induits par l’indice et reflète une véritable amélioration de la localisation de la cible (Spence & Driver, 1998).

Figure 3. Paradigme de l’indiçage orthogonal de Spence et Driver (1994) dans lequel la position de l’indice varie horizontalement alors que la position de la cible varie verticalement. Tiré de Wright et Ward (2008).

1.3.1 Aspects endogènes

Dès les premières études réalisées dans le domaine (p. ex. Bédart, El Massioui, Pillon

& Nandrino, 1993 ; Buchtel & Butter, 1988), il est clairement apparu que le déplacement cross- modal de l’attention pouvait s’effectuer intentionnellement en réponse à n’importe quel indice endogène qui contenait une information spatiale sur la cible subséquente à traiter, et ce, indépendamment de leur modalité sensorielle (Wright & Ward, 2008).

(20)

19

En utilisant une variante du paradigme d’indiçage orthogonal, Spence et Driver (1996) ont pu confirmer l’existence de déplacements attentionnels volontaires dans l’espace entre modalité visuelle et auditive avec une méthodologie rigoureuse. Dans leur tâche, un indice visuel (flèche centrale) ou un indice auditif (instruction verbale) indique avec une plus grande probabilité le côté correct (essai valide) que le côté incorrect (essai invalide) où apparaitra la cible visuelle (LED rouge) ou auditive (bruit blanc). Tout en fixant un point central, les participants doivent discriminer son élévation (en-dessus ou en-dessous de la ligne horizontale).

Les temps de réaction sont diminués dans les essais valides par rapport aux essais invalides, indépendamment de la modalité sensorielle de l’indice et de la cible. Ces résultats suggèrent que le déplacement intentionnel de l’attention vers un emplacement spatial peut être initié par un indice d’une modalité différente de celle de la cible à venir, ce qui accélère son traitement.

Pour étudier plus en détail ces effets, Spence et Driver (1996) ont induit une forte attente spatiale à l’intérieur d’une modalité sensorielle. Pour ce faire, la cible dans une modalité primaire est présentée 73 % du temps du côté indiqué par l’indice alors que la cible dans une modalité secondaire apparait 66 % du temps du côté opposé. Les participants sont plus rapides pour discriminer l’élévation de la cible présentée du côté indicé lorsqu’elle est dans la modalité primaire, mais également lorsqu’elle est dans la modalité secondaire alors qu’elle a deux fois moins de probabilité d’y apparaitre. Ces résultats suggèrent que lorsque les participants ont une forte attente quant au côté le plus probable d’apparition d’une cible presque uniquement visuelle ou auditive, ils déplacent intentionnellement leur attention à cet emplacement pour l’autre modalité aussi, et ce, sans motivation stratégique à le faire. Par contre, cet effet attentionnel est plus faible que pour la modalité primaire, ce qui suggère qu’un fort biais dans la distribution spatiale pour une modalité sensorielle se propage dans les autres modalités de manière réduite.

Cette observation a initialement été considérée comme une preuve en faveur de mécanismes attentionnels séparés, mais liés entre modalités sensorielles (Driver & Spence, 1998).

1.3.2 Aspects exogènes

A partir d’un événement dans une modalité sensorielle, l’attention peut être intentionnellement déplacée dans l’espace pour améliorer le traitement des informations présentées dans une autre modalité sensorielle. Est-ce que ce phénomène se retrouve également dans les cas où ce déplacement est involontaire et automatique ? Etablir l’existence de déplacements cross-modaux et exogènes de l’attention s’est initialement révélé complexe, notamment parce que des asymétries entre les modalités sensorielles ont été mises en évidence (Wright & Ward, 2008).

(21)

20

Ainsi, Spence et Driver (1997) ont tenté de déterminer si un événement saillant mais non-pertinent dans une modalité sensorielle pouvait attirer de façon réflexe l’attention dans une autre modalité. Pour ce faire, ils ont adapté le paradigme de l’indiçage orthogonal en utilisant des indices périphériques et spatialement non-prédictifs qui pouvaient être soit visuels (LED jaune) ou soit auditifs (tonalité pure). Tout en fixant un point central, les participants devaient les ignorer et uniquement discriminer l’élévation de la cible visuelle (LED rouge) ou auditive (bruit blanc). Les résultats indiquent qu’un son soudain et non-pertinent conduit à une discrimination plus rapide et plus précise de l’élévation d’une cible visuelle présentée du même côté de l’espace. Ceci suggère que des événements auditifs saillants peuvent capturer l’attention, ce qui améliore le traitement d’une cible visuelle qui apparaitra au même emplacement spatial. Toutefois, le pattern de résultats inverse n’a pas été observé, c’est-à-dire que la présentation d’un indice visuel périphérique n’affecte pas les jugements d’élévation pour une cible auditive. Cette découverte ayant été répliquée en variant les propriétés physiques des stimuli visuels et auditifs, les auteurs concluent à une règle générale sur la façon dont les modalités sensorielles sont liées entre elles plutôt qu’à des différences de saillance. La mise à jour de cette asymétrie a été utilisée initialement pour défendre l’idée de mécanismes attentionnels liés, mais séparés entre modalités sensorielles (Driver & Spence, 1998).

A partir du début des années 2000, la majorité des recherches en sont venues à la conclusion que les effets d’indiçage cross-modaux et exogènes existaient entre toutes les combinaisons possibles de stimuli visuels et auditifs (Eimer & Driver, 2001 ; Wright & Ward, 2008). L’échec répété des indices visuels pour capturer l’attention auditive relèveraient d’artéfacts en lien aux paradigmes utilisés plutôt que le reflet d’asymétries dans la nature des liens cross-modaux qui contrôlent l’allocation automatique de l’attention (Spence, 2010). Ainsi, la présentation périphérique d’un indice visuel ou auditif non-prédictif spatialement conduirait toujours à un déplacement attentionnel exogène, mais sa distribution spatiale dépendrait du caractère localisable de l’indice et donc de sa modalité sensorielle (Spence, 2010). Cette hypothèse de la « narrow zone » se base sur les spécificités spatiales des systèmes visuels et auditifs pour postuler qu’un indice visuel conduit à une focalisation attentionnelle extrêmement précise dans l’espace alors qu’un indice auditif englobe une plus large zone, ce qui permet le traitement d’une plus grande gamme d’emplacements (Wright & Ward, 2008). Dans les essais valides, la distance entre l’indice et la cible aurait été trop grande pour qu’un indice visuel permette le traitement attentionnel d’une cible auditive, mais suffisante pour qu’un indice auditif permette le traitement d’une cible visuelle (Prime, McDonald, Green & Ward, 2008).

(22)

21

Les études qui ont mis en évidence des effets d’indiçage exogène ont permis de fournir quelques preuves en faveur d’une capture attentionnelle cross-modale. Toutefois, les stimuli y sont présentés seuls et ne se trouvent donc pas en compétition pour l’attention comme dans les tâches de recherche visuelle (Theeuwes, 1991, 1992) et auditive (Dalton & Lavie, 2004, 2007) présentées précédemment. Spence, Ranson et Driver (2000) ont alors étudié si la capacité à ignorer activement des sons distracteurs dépendait de leur proximité spatiale avec un événement visuel à traiter simultanément. Dans leur tâche, les participants devaient répéter des triplets de mots diffusés derrière leur tête, tout en ignorant un flux auditif non-pertinent de mots provenant d’un des deux côtés en face d’eux. Simultanément, ils devaient fixer un affichage visuel localisé au même emplacement que celui des sons distracteurs (condition « même côté ») ou à la position inverse (condition « côté opposé »). L’événement visuel diffusé pouvait être soit des mouvements de lèvres correspondant aux mots pertinents (ce qui induisait un traitement attentionnel visuel actif) ou soit des mouvements de lèvres n’ayant pas de signification (ce qui induisait une fixation visuelle passive). Les résultats indiquent que la précision des participants diminue dans la condition « même côté » par rapport à la condition « côté opposé » et d’autant plus lorsque ce sont des mouvements de lèvre signifiants qui sont présentés. Ceci suggère que les sons distracteurs sont plus difficiles à ignorer lorsqu’ils sont présentés à l’emplacement où un traitement attentionnel visuel actif est en train d’être effectué. Une certaine séparation spatiale entre des événements de modalité différente serait nécessaire pour permettre le traitement attentionnel sélectif d’une cible, tout en ignorant efficacement des distracteurs non- pertinents de modalité différente.

1.4 Mécanisme(s) attentionnel(s) supramodal ou séparés, mais liés ?

La question centrale qui a émergé des recherches sur le déplacement attentionnel cross- modal a concerné la nature des mécanismes sous-jacents et deux hypothèses théoriques principales ont été développés pour expliquer les résultats observés (Eimer & Driver, 2001 : Figure 4).

Il a été suggéré que les déplacements attentionnels cross-modaux soient contrôlés par un système composé de mécanismes attentionnels séparés pour chaque modalité sensorielle, mais qui peuvent s’influencer sous certaines circonstances (Spence & Driver, 1996). Selon ce point de vue, les systèmes attentionnels visuels et auditifs opèrent sur une représentation de l’espace respectivement visuelle et auditive, mais de forts liens cross-modaux permettent de les coordonner pour qu’ils soient dirigés vers un même emplacement spatial (Spence, 2001). Cette hypothèse a d’abord été largement acceptée, car elle reposait sur deux évidences empiriques

(23)

22

majeures qui concernaient le déplacement cross-modal volontaire et automatique de l’attention.

D’une part, l’effet de validité plus faible d’un indice endogène pour la modalité sensorielle secondaire (Spence & Driver, 1996) et d’autre part, l’incapacité d’un indice exogène visuel pour capturer l’attention auditive (Spence & Driver, 1997), comme expliqué précédemment.

L’interprétation de ces deux observations ayant été réfutée par la suite, Spence et Driver (2010) en sont venus à considérer l’explication alternative, qui est prédominante actuellement.

L’hypothèse supramodale considère que les déplacements attentionnels cross-modaux sont contrôlés par un mécanisme attentionnel unique qui opère sur une représentation multisensorielle de l’espace (Farah, Wong, Monheit & Morrow, 1989). En ce sens, un événement dans n’importe quelle modalité sensorielle crée une activation sur une carte de l’espace qui est commune à la vision et l’audition. Si un certain seuil est atteint, cette activation déclenche un déplacement de l’attention à son emplacement, ce qui donne lieu à un traitement plus rapide et plus précis de l’objet qui s’y trouve (Wright & Ward, 2008). Cette explication a progressivement repris une importance centrale une fois les différentes limitations méthodologiques prises en compte, car il a été démontré de manière répétée qu’un indice visuel ou auditif permettait le déplacement, volontaire et automatique, de l’attention vers une cible visuelle ou auditive et que cela améliorait son traitement. Ainsi, comme ce phénomène est observé pour toutes les combinaisons de modalités sensorielles possibles, il n’y a plus lieu de postuler l’existence de mécanismes attentionnels séparés, mais liés entre eux (Spence, 2010).

Figure 4. Illustration théorique des mécanismes impliqués lorsqu’un indice visuel provoque un déplacement attentionnel cross-modal. Activation d’une représentation multisensorielle de l’espace (gauche) ou activation d’une représentation visuelle de l’espace qui coordonne le déplacement attentionnel dans les autres modalités.

Tiré de Wright et Ward (2008).

(24)

23

1.5 Electroencéphalographie et potentiels évoqués cérébraux

Les recherches comportementales présentées jusqu’à présent permettent de mettre en évidence des différences de temps de réaction et de précision entre conditions afin d’inférer l’existence de mécanismes attentionnels. Toutefois, elles sont limitées dans leurs interprétations, car elles ne permettent pas d’établir clairement la présence d’un déplacement attentionnel et de le différencier de phénomènes qui se produisent à d’autres étapes de traitement.

L’électroencéphalogramme (EEG) est une technique d’investigation cérébrale non- invasive qui permet d’enregistrer l’activité électrique corticale en microvolt grâce à des électrodes placées sur le scalp (Luck, 2014). Plus particulièrement, il s’agit d’analyser par techniques de moyennage des données, des potentiels évoqués, c’est-à-dire des fluctuations momentanées et systématiques de polarité à certaines électrodes qui reflètent l’activité neurophysiologique durant un traitement sensoriel, moteur ou cognitif (Luck & Hillyard, 1994).

Aussi appelées « composantes », ces fluctuations sont un moyen d’évaluer précisément le décours temporel en millisecondes des étapes de traitement d’un stimulus présenté (Hickey, McDonald & Theeuwes, 2006). Grâce à cette technique, il devient alors possible de mesurer la dynamique temporelle qui sous-tend la sélection attentionnelle dans des tâches de recherches spatiales ainsi que les effets de l’attention sur d’autres processus cognitifs (Luck & Hillyard, 1994).

1.5.1 Marqueurs électrophysiologiques de l’attention visuelle : N2pc et PD

Comment mentionné dans la partie sur l’attention visuelle, l’augmentation des temps de réaction entre les deux conditions du paradigme « additional singleton » est interprétée par Theeuwes (1991, 1992) comme le résultat d’une capture attentionnelle par le distracteur saillant. Celle-ci impliquerait un désengagement et une réallocation de l’attention qui allongent le temps de recherche. Toutefois, ces résultats peuvent aussi être interprétés à travers une hypothèse alternative qui se nomme le coût de filtrage non-spatial (Folk & Remington, 1998).

Celle-ci postule que l’attention est déployée de manière « top-down » vers la cible sans jamais passer par le distracteur, mais que la présence de celui-ci augmente la complexité de la recherche visuelle et que sa suppression non-spatiale allonge les temps de réaction (Becker, 2007). Le coût de filtrage est alors lié à la compétition entre deux items saillants (cible et distracteur) dans laquelle le sujet doit allouer son attention à la cible uniquement (Wykowska

& Shübo, 2010). Afin de soutenir l’hypothèse de la capture attentionnelle par le distracteur et d’exclure celle du coût du filtrage non-spatial, Hickey et al. (2006) ont adapté le paradigme

(25)

24

« additional singleton » pour effectuer des mesures électrophysiologiques qui permettent de suivre précisément le décours temporel du déploiement spatial de l’attention visuelle.

Plus particulièrement, la N2 posterior contralateral (N2pc) est un potentiel évoqué qui représente un marqueur électrophysiologique de la sélection attentionnelle visuo-spatiale latéralisée, soit par suppression des items entourant la cible (Luck & Hillyard, 1994) ou soit par traitement de ses propriétés (Eimer, 1996). Il s’agit d’une déflexion négative durant l’intervalle de temps N2 (entre 175 et 300 ms après la présentation du stimulus), plus importante aux électrodes pariétales P07 et P08 controlatérales qu’ipsilatérales au stimulus sélectionné (Luck

& Hillyard, 1994 : Figure 5).

Figure 5. Illustration de la N2pc. Représentation topographique pariéto-occipitale (gauche) et différence entre le signal controlatéral et ipsilatéral des électrodes P07 et P08 pour la fenêtre temporelle 200 – 280 ms (droite). Tiré

de Burra et Kerzel (2013).

Fonctionnellement, comme cette composante est déclenchée lors de la sélection attentionnelle de stimuli placés dans un des hémichamps visuels latéraux et pas lorsqu’ils sont placés sur la ligne médiane verticale, il a été possible d’isoler l’activité associée à une cible ou un distracteur en alternant leur position (Woodman & Luck, 2003). En se basant sur ce principe, Hickey et al. (2006) ont utilisé le paradigme « additional singleton » de Theeuwes (1991) dans lequel la cible changeait de forme aléatoirement entre les essais (un losange parmi des cercles ou un cercle parmi des losanges). Ils ont mis en évidence une N2pc de même amplitude pour la cible dans la condition sans distracteur et pour le distracteur latéral dans la condition où la cible se trouvait sur la ligne médiane verticale. De plus, dans la condition où la cible et le distracteur étaient placés dans des champs visuels opposés, ils ont observé une N2pc controlatérale au distracteur dans un premier temps puis controlatérale à la cible dans un deuxième temps. Pris ensemble, ces résultats suggèrent que l’attention a initialement été capturée par le distracteur et a été ensuite réorientée vers la cible, ce qui représente de solides arguments en faveur de l’hypothèse de la capture attentionnelle (Theeuwes, 2010).

(26)

25

Par la suite, d’autres études (Schubö, 2009 ; Wykowska & Schubö, 2010) ont utilisé une version du paradigme « additional singleton » de Theeuwes (1992) dans laquelle la forme de la cible restait la même pour chaque essai (toujours un losange). Dans la condition où la cible était placée sur la ligne médiane verticale et le distracteur saillant en position latérale, ces études n’ont pas mis en évidence de N2pc pour le distracteur. Pour expliquer ces résultats contradictoires, Burra et Kerzel (2013) ont proposé d’étudier l’effet de la prédictibilité de la cible sur la capture attentionnelle par le distracteur en comparant les deux versions du paradigme « additional singleton » (Theeuwes, 1991, 1992). Plus particulièrement, ils ont utilisé une condition dans laquelle la forme de la cible était imprévisible, c’est-à-dire qu’elle variait aléatoirement d’essai en essai (un losange parmi des cercles ou un cercle parmi des losanges) et une autre dans laquelle elle était prévisible (toujours un losange). Cette manipulation devait induire deux modes de recherche différents (Bacon & Egeth, 1994) : la recherche d’une caractéristique particulière (« feature search mode ») lorsque la cible était prévisible ou la recherche d’un élément singulier (« singleton search mode ») lorsque la cible était imprévisible. Lorsque la cible était placée sur la ligne médiane verticale et le distracteur en position latérale, la N2pc au distracteur était présente quand la forme de la cible était imprévisible, mais pas quand elle était prévisible, ce qui permet d’expliquer les divergences entre les observations précédentes (Hickey et al., 2006 ; Shubö, 2009 ; Wykowska & Schubö, 2010). Toutefois, dans la condition prévisible, la N2pc au distracteur, censée refléter la capture attentionnelle, était remplacée par une « distractor positivity » (PD) qui indique sa suppression active afin de traiter plus rapidement la cible. Ceci amène les auteurs à conclure que l’effet des distracteurs sur la sélection attentionnelle peut être modulé par les exigences de la tâche.

Il avait déjà été suggéré que la sélection attentionnelle visuo-spatiale reflétée par la N2pc pouvait reposer sur deux mécanismes attentionnels distincts qui concernent la cible ou le distracteur et qui sont sous-tendus par des sous-composantes électrophysiologiques différentes.

Ainsi, Hickey, Di Lollo et McDonald (2009) avaient proposé que la N2pc représentait la sommation d’une négativité controlatérale appelée NT (Target Negativity) associée au traitement des propriétés de la cible et d’une positivité controlatérale appelée PD (Distractor Positivity) associée à la suppression attentionnelle active des stimuli distracteurs non- pertinents. Dans la situation où un distracteur est présenté en position latérale en même temps qu’une cible dans l’hémichamp visuel opposé, les sous-composantes NT et PD s’additionnerait pour donner lieu à une N2pc (Kiss, Grubert, Petersen & Eimer, 2012). Plus particulièrement, tout comme la N2pc, la PD est une composante latéralisée qui apparait 200 à 300 ms post-

(27)

26

stimulus au niveau postérieur controlatéral (électrodes P07/P08). Toutefois, à l’inverse de la N2pc, il s’agit d’une déflexion positive qui est observée uniquement en réponse à un distracteur (Hickey et al., 2009). Ainsi, même si les distracteurs saillants déclenchent toujours un signal attentionnel (« attend-to-me signal »), ils peuvent être activement supprimés afin d’empêcher qu’une capture attentionnelle se produise, ce que la PD reflèterait (Sawaki & Luck, 2010).

1.5.2 Marqueurs électrophysiologiques de l’attention auditive : N2ac et LPCpc

Alors que la N2pc a largement été utilisée pour étudier la sélection attentionnelle en modalité visuelle, l’utilisation de méthodes électrophysiologiques pour l’investiguer lors d’une recherche auditive est plus rare. Récemment, en adaptant à la modalité auditive le design expérimental utilisé dans les études sur la N2pc, Gamble et Luck (2011) ont mis à jour que le déploiement spatial de l’attention auditive vers l’emplacement de signaux sonores permettait également de mesurer un potentiel évoqué latéralisé. Dans leur expérience principale, les sujets devaient détecter la présence d’un type particulier de son (p. ex. une voix d’enfant) dont la position (haut-parleur gauche ou droite) variait aléatoirement entre les essais, alors qu’un distracteur sonore était présenté simultanément du côté opposé. Les résultats électrophysiologiques indiquent la présence d’une déflexion négative plus importante aux électrodes antérieures (C3/4, CP5/6, FC5/6 et T7/8) controlatérales à la cible auditive qu’ipsilatérales, durant l’intervalle de temps N2 (entre 175 et 300 ms après sa présentation).

Les auteurs suggèrent alors que cette composante, nommée N2 anterior contralateral (N2ac), reflète l’allocation de l’attention auditive à l’emplacement de la cible sonore, en présence simultanée d’un distracteur.

Par la suite, Gamble et Woldorff (2014) ont utilisé de multiples sons, distribués dans le temps et l’espace, afin de créer une situation de recherche auditive plus naturelle et ont confirmé que la N2ac était une composante analogue à la N2pc en modalité visuelle. La N2ac reflète donc bien le déplacement de l’attention auditive à l’emplacement d’une cible latérale parmi des distracteurs (Lewald & Getzmann, 2015). Les études (Gamble & Luck, 2011 ; Gamble &

Woldorff, 2014) qui se sont intéressées à la sélection attentionnelle d’une cible sonore latérale dans une scène acoustique complexe ont également rapporté la présence d’une autre composante latéralisée. Contrairement à la N2ac, la Late Positive Component posterior- controlateral (LPCpc) est une composante positive qui apparait plus tardivement (500 ms après la présentation du stimulus) aux électrodes postérieures (O1/2, P7/8, PO3/4 et P3/4 : Lewald, Hanenberg & Gertzmann, 2016). Fonctionnellement, la LPCpc est censée refléter la réorientation spatiale de l’attention auditive de l’emplacement de la cible au centre, ce qui

(28)

27

suggère un désengagement attentionnel. Ce faisant, autant la N2ac que la LPCpc permettent d’étudier la dynamique temporelle du déploiement spatial de l’attention auditive en direction d’une cible sonore (Lewald, Hanenberg & Gertzmann, 2016).

1.6 Hypothèse de la capture attentionnelle par la menace

Comme discuté jusqu’à présent, un événement visuel ou auditif saillant peut provoquer un déplacement attentionnel automatique et involontaire à son emplacement, et ce, même s’il n’a pas de pertinence pour la personne (Theeuwes, 1991, 1992). Toutefois, bien que les propriétés physiques des stimuli jouent un rôle central dans ce phénomène, la capture attentionnelle peut également être déclenchée par leur contenu émotionnel (Theeuwes, 2010 ; Vuilleumier, 2005). Ce biais attentionnel en faveur des événements émotionnels, et plus particulièrement en faveur de ceux qui ont un caractère menaçant, suggère qu’ils reçoivent un traitement préférentiel en raison du rôle central qu’ils jouent dans la survie (Fox et al., 2000 ; Lang, Davis & Öhman, 2000 ; Weymar, Löw, Öhman & Hamm, 2011). Il existerait alors un système de détection de la menace qui biaiserait le système attentionnel pour les révéler en allouant un minimum de ressource à l’environnement alentour, ce qui représente un bénéfice adaptatif (LeDoux, 1996).

Dans cette optique, Öhman et Mineka (2001) ont formulé l’hypothèse de la capture attentionnelle par la menace en postulant que sa détection est automatique et précoce, c’est-à- dire réalisée avant les opérations d’attention sélective et de perception consciente afin de faciliter son traitement ultérieur. Ceci serait possible grâce à un module spécialisé dans le déclenchement et l’apprentissage de la peur qui possède quatre caractéristiques. Premièrement, ce module est hautement sélectif, car il est façonné par des contingences évolutives afin de détecter préférentiellement les stimuli aversifs et pertinents au sens phylogénétique, c’est-à-dire ceux qui constituent une menace pour l’organisme (Sélectivité). Deuxièmement, il est activé précocement par ces stimuli afin de leur donner une priorité immédiate en nécessitant un minimum de traitement (Automaticité). Troisièmement, le maintien de son activité est relativement impénétrable au contrôle cognitif volontaire (Encapsulation). Pour finir, ce module est sous-tendu par un circuit neuronal sous-cortical spécifique dans lequel le complexe amygdalien joue un rôle prépondérant (LeDoux, 1996).

En se basant sur ce cadre théorique, Öhman, Flykt et Esteves (2001) ont étudié la sélection attentionnelle préférentielle de menaces pertinentes d’un point de vue évolutif. Leur expérience consistait à présenter des catégories de stimuli menaçants (serpents et araignées) et non-menaçants (fleurs et champignons). La tâche des participants était de détecter la présence

(29)

28

d’un stimulus discordant dans des matrices d’images, soit composée d’exemplaires de la même catégorie (p. ex. fleurs) ou soit incluant une cible d’une différente catégorie (p. ex. serpents).

Les résultats indiquent que les stimuli menaçants sont détectés plus rapidement, indépendamment de leur emplacement ainsi que du nombre de distracteurs et de manière plus marquée chez les participants qui ont rapporté en avoir peur. Cette recherche soutient l’hypothèse de Öhman et Mineka (2001) selon laquelle l’attention est allouée prioritairement à des événements à caractère menaçant, ce qui permet de préparer une réponse rapide en cas de danger. En utilisant une mesure électrophysiologique (N2pc) et un design expérimental sensiblement similaire, Weymar, Gerdes, Löw, Alpers et Hamm (2013) en sont arrivés aux mêmes conclusions.

1.6.1 Menaces visuelles : visages de colère

A l’échelle humaine, la menace peut se manifester visuellement à travers certaines expressions faciales. En effet, en véhiculant une information sur l’état émotionnel et les intentions d’une personne, celles-ci peuvent avertir de manière non-verbale qu’une conséquence négative va probablement se produire dans l’échange social en cours (Öhman, Lundqvist & Esteves, 2001). Ce faisant, l’hypothèse de Öhman et Mineka (2001) prédit que l’allocation de l’attention doit également être biaisée en direction de visages qui transmettent un contenu émotionnel menaçant tel que la colère (Sélectivité), de manière précoce dans le traitement attentionnel (Automaticité) et lorsque ceux-ci ont le rôle de distracteur en compétition avec une cible (Encapsulation).

Les tâches de recherche visuelle composée d’expressions faciales émotionnelles ont en partie rapporté ce phénomène, appelé classiquement « Anger Superiority Effect » (Hansen &

Hansen, 1988). Celui-ci désigne le fait que les expressions de colère, autant schématiques (Fox et al., 2000 ; Öhman et al., 2001) que naturelles (Pinkham, Griffin, Baron, Sasson & Gur, 2010), sont détectées plus rapidement et précisément que les expressions de joie parmi une foule de visages distracteurs et ce, indépendamment de sa taille et de l’orientation des visages (Figure 6).

Ceci indique que les expressions faciales menaçantes, en tant que cibles, bénéficient d’une sélection attentionnelle préférentielle et sont traitées de manière privilégiée. De plus, ces nombreux résultats comportementaux sont appuyés par des évidences issues d’études électrophysiologiques. Ainsi, Weymar et al. (2011) ont utilisé la composante N2pc comme indicateur précoce du déploiement spatial de l’attention visuelle et ont mis en évidence que son amplitude était plus importante lorsque les participants devaient indiquer la présence d’un visage de colère plutôt que celle d’un visage de joie parmi des visages neutres. Prises ensemble,

(30)

29

ces recherches confirment l’existence d’un système de détection de la menace (Öhman &

Mineka, 2001) qui biaise l’allocation de l’attention visuelle à son emplacement et confirment ses aspects de Sélectivité et d’Automaticité en modalité visuelle.

Figure 6. Illustrations des conditions contenant une expression faciale de colère en tant que cible parmi des visages neutres, dans l’étude de Öhman et al. (2001) à gauche et de Pinkham et al. (2010) à droite.

Toutefois, le traitement préférentiel des visages de colère mis en évidence dans ces études peut-être la conséquence d’une sélection attentionnelle top-down dans le but de rechercher une expression émotionnelle discordante (Burra, Barras, Coll & Kerzel, 2016). Ce faisant, ces recherches ne permettent pas de tirer des conclusions sur la caractéristique d’Encapsulation de l’hypothèse de Öhman et Mineka (2001). Pour étudier cet aspect, il est nécessaire de s’intéresser à la capture attentionnelle par un visage de colère, en tant que distracteur non-pertinent. C’est précisément ce que Huang, Chang et Chen (2011) ont fait en proposant une tâche de recherche visuelle composée de visages schématiques neutres parmi lesquels une expression émotionnelle de joie ou de colère était présente dans 80 % des essais.

Les participants devaient discriminer la position (gauche ou droite) d’un point situé sur le visage cible, celui-ci pouvant être neutre ou émotionnel. Les résultats indiquent qu’en présence d’un visage émotionnel distracteur, les temps de réaction sont allongés par rapport à ceux de la condition sans distracteur, mais que l’effet d’interférence des expressions de colère et de joie est similaire. Cette observation est confirmée par l’étude de Hodsoll, Viding et Lavie (2011) qui consistait à présenter des visages naturels émotionnels (colère, joie ou peur), cibles ou distracteurs, parmi des visages neutres. Les participants devaient discriminer l’orientation (penché à gauche ou à droite) du visage masculin (ou féminin) parmi des visages féminins (ou masculins). Les résultats sont conformes à ceux obtenus par Huang et al. (2011), c’est-à-dire que la présence d’une expression émotionnelle distractrice, autant de colère, de joie que de peur, provoque une augmentation des temps de réaction pour traiter la cible par rapport à la condition

(31)

30

sans distracteur (Figure 7). Ces deux observations semblent être en contradiction avec la caractéristique d’Encapsulation de l’hypothèse de Öhman et Mineka (2001), car celle-ci prédit que l’expression émotionnelle distractrice de colère doit capturer l’attention de manière plus importante que celle de joie.

Figure 7. Illustrations des conditions contenant une expression faciale de colère en tant que distracteur parmi des visages neutres, dans l’étude de Huang et al. (2011) à gauche et de Hodsoll et al. (2011) à droite.

Il est alors possible que les mesures comportementales utilisées dans ces études ne soient pas suffisamment sensibles pour révéler ce phénomène. En effet, les temps de réaction sont le résultat de plusieurs étapes de traitement donc ils peuvent autant refléter une capture attentionnelle précoce par l’expression distractrice de colère que des biais de réponse plus tardifs qui ne permettent pas de distinguer son effet de celui de la joie (Burra et al., 2016). Pour départager ces deux explications, il est nécessaire de faire appel à une mesure électrophysiologique qui puisse refléter le déploiement précoce de l’attention dans l’espace.

Ainsi, en reprenant le paradigme « additional singleton » de Theeuwes (1991, 1992), Burra et al. (2016) ont étudié la capture attentionnelle par des expressions faciales distractrices de colère au moyen de la composante N2pc. Leur tâche était composée de six visages schématiques qui entouraient une croix de fixation dans laquelle les participants devaient détecter le seul visage neutre qui avait un nez incliné puis devaient discriminer son orientation (gauche ou droite).

Dans 33 % des essais, tous les autres visages étaient également neutres alors que dans 66 % des essais une expression émotionnelle distractrice de colère ou de joie était présente (Figure 8).

Les résultats électrophysiologiques ont montré que les distracteurs de colère déclenchaient une N2pc de plus grande amplitude que ceux de joie, ce qui indique qu’ils capturent de manière plus importante l’attention. Toutefois, les résultats comportementaux sont similaires à ceux de Hodsoll et al. (2011) et Huang et al. (2011), c’est-à-dire que les temps de réaction sont allongés en présence d’un distracteur émotionnel, mais sans qu’il n’y ait de différence entre les émotions.

Références

Documents relatifs

Dans les systèmes de segmentation automatique, l'utilisation de paramètres basée sur les mots s’inspire de techniques comme le modèle statistique de langue ou par

[une

Exprimer l'avancement final x f de la réaction entre l'acide AH et l'eau en fonction de  , des conductivités molaires ioniques utiles et du volume V S (on pourra s'aider

La conjonction d’un diagnostic d’assez fort isolement du monde des enseignants de la conduite et de la sécurité routière, par rapport au monde de l’éducation à la

Recomposition des écosystèmes financiers européens après la crise[/lang_fr] [lang_en] Beyond “financial repression” and “regulatory capture.” The political economy of

El autor de este artículo se interesa por la réplica de Albert Bayet, quien se expresa al mismo tiempo como profesor racionalista que defiende el legado de la Ilustración,

Le présent travail dont le thème est «Influence de la nature du sol et de la topographie sur la distribution spatiale de Julbernardia seretii (De Wild) Troupin et de

Non, la situation dans le monde ne s’améliore pas, en dépit d’e ff orts importants de beaucoup, d’hommes et de femmes engagés chacun dans leur discipline, pour que la paix