• Aucun résultat trouvé

2.3 Les visages : de la théorie à la perception

2.3.4 Perception et traitement holistique

La perception des visages est un thème qui aujourd’hui encore, représente une part importante de la recherche sur le domaine. Percevoir un visage, c’est avoir une quantité importante d’information sur une tierce personne, comme son genre, son âge, son ethnie mais également sur ces intentions et ses états mentaux (je vous renvoie à la section sur la théorie de l’esprit). Il semblerait que la perception d’un visage dépende des représen- tations prototypiques internes que nous avons pu acquérir au cours de notre vie [322]. Ainsi, Smith et al en 2012, ont demandé à des sujets d’indiquer sur des images de bruit blanc quand ils voyaient des visages (on leur disait que 50% des images étaient des vi- sages). La subtilité de cette tâche réside dans le fait qu’aucune image de visage n’était présentée, le sujet devait alors utiliser ses propres représentations internes d’un visage afin de réussir la tâche. Ils ont alors pu mettre en évidence que dans 44% des stimuli présentés, les sujets indiquaient avoir perçu un visage, et que ceci se retrouvait dans la modulation des tracés EEG [322]. De part cette expérience intéressante, il semblerait que la perception des visages soit basée sur les représentations internes créées par la

multitude de visages perçus au quotidien depuis notre plus jeune âge.

Les visages sont ils spéciaux ? C’est en tout cas une des hypothèses qui a été émise. Mais pourquoi alors pouvons-nous considérer ces visages comme à part ? D’une part, cela vient du fait que les visages sont vecteurs de quantités d’informations comme l’âge, le genre, l’ethnie, l’émotion, l’intention, toutes ces choses qui rendent ces visages ex- cessivement spécifiques. Toutes ces informations ne sont pas présentes dans les objets. D’autre part, cela vient aussi d’une illusion connue décrite par Thompson en 1980 : l’ef- fet Thatcher [341]. En utilisant des images de Margaret Thatcher modifiées, Thompson a pu mettre en évidence que les visages avaient une représentation canonique et une représentation spatiale bien précise. En effet, quand les visages sont présentés à l’envers, les modifications apportées à un visage sont difficilement perçues. Par ailleurs, quand ces mêmes visages étaient présentés à l’endroit, alors les modifications devenaient ap- parentes, voire grossières. La Figure 2.8 illustre parfaitement ces propos. Vous pouvez constater que sur le panel du haut, si l’on vous demande de dire si ces visages sont identiques ou non, vous pouvez très facilement être trompé et indiquer que ces deux visages sont similaires. Pour indiquer précisément et de façon sûre que ces visages sont différents, cela vous demandera un temps d’analyse beaucoup plus long. Néanmoins, sur les présentations du panel du bas, il n’y a aucune hésitation à avoir, ces visages sont bien différents (pourtant si vous retournez la feuille, vous vous apercevrez que ces sont les mêmes visages que ceux du panel du haut). Les sujets sains seront alors meilleurs à traiter les visages à l’endroit qu’à l’envers.

Le fait que nous soyons meilleurs à traiter des visages à l’endroit est, d’un point de vue expérimental, tester via l’effet d’inversion. Il consiste le plus généralement en des tâches d’appariement ou de reconnaissance de visages et cet effet se traduit par une augmentation des temps de réponse et des proportions d’erreurs commises plus fortes. Il semblerait que lorsqu’un visage est présenté à l’envers, il perde son sens "visage" et que son traitement devienne comme celui d’un objet classique, d’où la nécessité d’un traitement configural spécifique. De plus, l’effet d’inversion est nettement moindre sur d’autres types d’objets, renforçant la spécificité des visages en tant que stimulus spécial.

Enfin, un autre argument favorise la spécificité des visages. Malgré la grande variabi- lité des visages présents sur Terre, chacun est issu d’une configuration identique. Cette catégorie visuelle diverge des autres catégories car nous pouvons (ou devons) la traiter à un niveau individuel. L’expertise de traitement des visages prend alors tout son sens, puisque sans cette expertise, il nous serait difficile d’efficacement et rapidement iden- tifier les visages et ses composantes. Sans cette expertise, reconnaître individuellement une personne représenterait une charge cognitive énorme pour notre cerveau, et serait énergivore et chronophage. Cette expertise se retrouve, d’une certaine façon, au niveau cérébral. La spécificité des visages a entrainé le développement de modules cérébraux spécifiques de leur traitement, reliés entre eux par un réseau complexe et étendu, réseau que nous avons abordé précédemment.

Figure 2.8 –Illustration de l’effet Thatcher décrit initialement par Thompson en 1980. A : présentation des visages inversés, avec à droite les yeux et la bouche qui sont conservés à l’endroit. B : les mêmes visages que dans le A mais présentés cette fois-ci à l’endroit. Là où sur les visages à l’envers, il peut parfois être difficile de dire que ces visages sont différents, en présentation canonique les différences sont évidentes.

Les visages : une spécificité humaine ?

Nous avons vu que les visages représentaient un stimulus particulier pour l’Homme que ce soit au niveau cérébral que perceptif. Cependant qu’en est-il des autres espèces animales ? Les visages représentent-ils aussi une catégorie à part ?

Les primates sont probablement les animaux bénéficiant d’un traitement des visages le plus proche du notre et l’ensemble des espèces de primates testées est capable de re- connaître individuellement un visage. Par exemple, les chimpanzés semblent utiliser une approche configurale pour le traitement des visages, puisque leurs performances de reconnaissance sont sensibles aux effets d’inversion et aux manipulations des caractéris- tiques spatiales faciales [222]. Ces effets ont été largement décrits chez l’Homme, ce qui nous pousse à considérer que les chimpanzés auraient un traitement des visages assez similaire au notre. De plus, les chimpanzés ainsi que les macaques, sont en mesure de coordonner des mouvements faciaux avec des vocalisations acoustiques. De ce fait, ces espèces sont alors sensibles à la congruence audiovisuelle qui leur permet d’améliorer leur compréhension des signaux sociaux.

tré qu’ils étaient à même de reconnaitre un autre mouton et ce, au niveau individuel. De plus, ils ont les capacités de reconnaitre l’image d’un congénère même si les informations ont été réduites ou si l’image est présentée en petite taille [222]. De plus, comme chez les humains, les moutons ont une dominance hémisphérique droite dans le traitement de l’identification d’autres images de moutons.

Sur des aspects plus complexes comme la reconnaissance de son propre visage (corps), il semblerait que peu d’animaux soient en mesure que reconnaître leurs re- flets dans un miroir. Les éléphants, les dauphins et les grands singes semblent les seuls à avoir cette habileté. En effet, lorsque l’on place une marque sur le corps d’un éléphant et qu’on le place devant un miroir, il est capable de se reconnaître et de retirer la marque qui ne lui appartient pas [222]. Au même titre que les éléphants, lorsque l’on met un point rouge sur un orang-outang, celui-ci cherchera à le faire disparaître lorsqu’il se verra dans un miroir. De façon plus surprenante, les pies seraient également capables de se reconnaître dans un miroir. Ceci est le signe que ces animaux perçoivent quelque chose d’anormal étant situé sur leur propre corps et qu’ils ont donc une représentation mentale d’eux-mêmes.

Il faut noter toutefois que l’évaluation du traitement des visages (simplifier au niveau de la reconnaissance) n’est possible que sur des espèces ayant une bonne acuité visuelle. Chez de nombreuses espèces qui n’ont pas de dominance visuelle, la reconnaissance de conspécifiques s’effectue par l’audition, voire par des vecteurs chimiques.

Traitement holistique

L’effet d’inversion décrit précédemment conduit à une notion importante lorsque l’on parle de traitement des visages : il s’agit de la notion de traitement holistique. Il est défini comme la capacité à réunir un ensemble de caractéristiques en une repré- sentation perceptive globale [288]. Ainsi, ce traitement holistique est particulièrement efficace pour la reconnaissance des visages et nous permet de retenir de façon rapide et précise des visages en mémoire. Par ailleurs, cette spécificité de traitement serait déjà présente chez les enfants, et ce dès l’âge de 4 ans et continuerait à se développer au cours de l’enfance et de l’adolescence [92].

Quand on parle de configuration faciale, il faut diviser les relations configurales en deux types. Tout d’abord, il y a les informations configurales de premier ordre. Ces informations selon Rhodes [276] peuvent être caractérisées de façon indépendante les unes des autres et peuvent être énoncées par un simple mot (exemple, le nez, la bouche, les yeux).

Ensuite, il est défini les informations configurales de deuxième ordre. Il s’agit des posi- tions et des relations spatiales entre les différentes caractéristiques de premier ordre, par exemple la distance inter-oculaire, ou la distance entre le nez et la bouche. Ces relations

spatiales configurales de second ordre nous faciliteraient l’identification des visages. Ce traitement permettrait une meilleure discrimination des caractéristiques faciales dans lesquelles nous pouvons inclure les très fins mouvements inhérents aux émotions faciales. Enfin, nous avons les caractéristiques de haut rang. Ces caractéristiques sont dépen- dantes de l’ensemble des caractéristiques précédentes. Elles vont nous renseigner, entre autre, sur l’âge, le genre, l’ethnie. Par exemple, l’âge est la résultante de plusieurs carac- téristiques bien précises comme des cheveux blancs, des rides, des tâches de vieillesse... [276]

Figure 2.9 –Les images du haut, panel A, en noir et blanc sont appelées les Mooney Faces, que l’on perçoit en tant que visages à l’endroit mais pas quand elles sont à l’envers (Panel B). En couleur, panel C, les visages du peintre Giuseppe Arcimboldo, constitués de fruits et de légumes, mais qui ont comme forme globale celle d’un visage ; présentées à l’envers dans le panel D. Issu de la revue de Rossion et al [293].

L’inversion affecte le traitement de différents types d’informations. Premièrement, elle perturbe le traitement des informations configurales dites de deuxième ordre qui sont essentielles dans la reconnaissance des visages (il s’agit des relations spatiales fines entre les traits faciaux). Ces configurations sont particulièrement sensibles aux trans- formations verticales engendrées par l’inversion d’un visage [289]. C’est probablement pourquoi il est très difficile de reconnaître les visages lorsqu’ils sont présentés à l’en- vers. Deuxièmement, elle perturbe le traitement des informations configurales dites de premier ordre. Ces informations correspondent à l’arrangement de base des principaux

traits de tous les visages : deux yeux, au-dessus d’un nez, lui-même au-dessus d’une bouche. Ainsi, l’inversion des visages altèrerait également le traitement holistique des visages. En effet, afin de créer une perception globale, nous avons besoin d’un champ perceptif (face percetual field) large nous permettant de capter l’intégralité des ca- ractéristiques d’un visage. Or, l’inversion affecte fortement le champ perceptif en le diminuant, ce qui nous contraint à favoriser une approche locale pour notre traitement visuel [289].

Sur la Figure 2.9, plusieurs types de stimuli peuvent induire à percevoir un visage. Cette perception repose avant tout sur une représentation globale des informations pré- sentes sur l’image. Dans le panel du haut, des Mooney Faces (des images en constraste de noir et blanc) sont illustrées qui, lorsqu’elles sont présentées à l’endroit, peuvent induire la perception d’un visage. Ces mêmes images, lorsqu’elles sont présentées à l’en- vers (panel B) ou encore de façons découpées (panel E) perdent leur notion de visage. Il en va de même pour les peintures de Giuseppe Arcimboldo (panel C) qui, dans leur globalité, reprennent les formes caractéristiques d’un visage (Figure 2.9). Le fait de voir un visage repose sur notre capacité à traiter les informations de façon globale, en un percept unifié. Si l’on s’attarde davantage sur les détails des peintures d’Arcimboldo, il sera possible d’apercevoir que ces peintures sont composées de fruits et de légumes. Il semblerait que le traitement analytique, par caractéristiques, soit plutôt bien préservé pour les visages inversés (dans le cas des peintures, même à l’envers on peut toujours percevoir les légumes), mais la perception d’un visage comme un tout est altérée par l’inversion. Pour les visages, cette étape analytique fine, ne fait plus partie du traite- ment holistique, mais intègre les processus d’une analyse par caractéristique importante pour l’identification d’un visage.

Le test des visages composites est un des tests les plus utilisé quand on veut tester les capacités de traitement holistique d’un participant. Ce test consiste à présenter des stimuli de visages divisés en deux moitiés. Ces deux moitiés peuvent provenir du même visage ou d’un visage différent, qu’il soit connu on inconnu. La présentation se fait en plusieurs versions, les moitiés étant soit alignées soit décalées et/ou les visages peuvent être en présentation canonique ou inversée. La tâche consiste alors à indiquer si deux moitiés faciales supérieures sont identiques. Les résultats obtenus sont excessivement réguliers entre les différentes expérimentations. Ils se traduisent par un allongement des temps de réponse et une diminution des performances de réussite. L’illusion des visages composites crée la sensation que les moitiés supérieures sont différentes, ce qui n’est pas, bien évidemment, toujours le cas (Figure 2.10). La régularité dans les résultats, ainsi que l’effet induit par cette tâche, ont conduit les chercheurs à considérer l’effet des visages composites comme un indicateur de la perception holistique.

Grâce au traitement holistique, les jugements de la moitié faciale cible seront altérés par les changements causés par l’autre moitié faciale lorsque les visages sont à l’endroit et les moitiés alignées. Cet effet disparait lorsque les moitiés ne sont plus alignées ou

Figure 2.10 – Illusion des visages composites. Panel A : le premier visage en vert est le visage cible. Puis on lui attribue différentes moitiés inférieures (représentées par les rectangles rouges). Lorsque les moitiés inférieures changent, nous avons alors l’impression d’un nouveau visage, d’un nouveau percept unifié, la moitié supérieure semble elle-aussi différente. Or celle- ci est strictement identique entre les 5 présentations. Panel B : les mêmes moitiés faciales qu’utilisées dans le panel A mais présentées de façon décalées. L’illusion de l’apparition d’un visage composite n’est plus présente. Il est alors beaucoup plus simple d’indiquer que les moitiés supérieures sont identiques. Issu de la publication de Rossion et al [290].

encore lorsque le visage est présenté à l’envers [290]. L’effet des visages composites peut servir d’indicateur à la présence de troubles du traitement des visages. Par exemple, dans certaines pathologies comme la prosopragnosie congénitale, ou encore dans les troubles du spectre de l’autisme, la perception holistique serait altérée à la fois pour les visages mais également pour les objets [87]. Néanmoins, la corrélation entre la puis- sance des capacités holistiques et les performances de reconnaissance faciale ne fait pas consensus. Il semblerait que posséder une bonne intégration holistique soit un avantage pour la reconnaissance faciale, mais ne soit pas nécessaire [290].

Le traitement global d’un visage peut aussi être appréhendé par la Part-Whole Task. Dans cette tâche, on demande aux participants d’indiquer si des parties isolées (par exemple des yeux) appartiennent à un visage présenté dans sa globalité. Les résultats indiquent que la perception des parties du visage est plus précise lorsque le visage est entier à l’endroit que lorsque les parties sont présentées séparément. Ceci peut traduire le fait que les éléments constituant un visage ne sont pas perçus isolément mais comme une intégration dans une unité visuelle plus large qu’est le visage. L’effet part-whole

est dirigé par une augmentation des performances dans la condition globale (visage normal), alors que l’effet composite repose sur une augmentation du nombre d’erreurs dans la condition alignée [275].

En résumé, pour qu’un visage soit traité de façon holistique, il faut qu’il y ait une continuité dans les caractéristiques, une uniformité. Lorsqu’un visage va perdre sa "vi- sagéité", c’est à dire son sens de visage en tant que stimulus visuel, il sera alors traité de façon analytique, caractéristique par caractéristique. Ainsi de nombreuses études ont utilisé un ensemble de manipulations qui brisent l’intégrité d’un visage et le regroupe- ment global que nous utilisons grâce à notre expertise. Par exemple, le test des visages composites en condition non-aligné casse l’uniformité du visage (en décalant la moitié supérieure de la moitié inférieure). Il est possible aussi d’augmenter la distance entre les caractéristiques ou d’inverser le sens du visage pour mettre en évidence un traitement global [87].

Comme évoqué en introduction de cette section sur la perception des visages, l’hypo- tèse dite du "holistic template-matching" définit que nous nous basons sur un template personnel afin de reconnaître un visage. Le traitement des informations faciales prove- nant d’une image de visage à l’endroit ou à l’envers est alors comparé à un template de visage à l’endroit [136]. La perception holistique est fortement dépendante des repré- sentations internes. La puissance de l’effet composite augmente pour les catégories de visages humains du type morphologique le plus fréquemment rencontré ou par exemple, pour les visages appartenant à la même ethnie que l’observateur [290]. Plus le visage présenté va s’éloigner de notre prototype personnel, plus il sera difficilement recon- naissable parmi d’autres visages. Ceci permettrait d’expliquer pourquoi nous sommes sensiblement moins bons à mettre en relation deux visages lorsque ceux-ci sont présentés à l’envers ou lorsqu’ils sont trop éloignés des visages fréquemment rencontrés (d’ethnie différente).

Enfin, le traitement holistique des visages accentue le fait que la perception faciale est un processus dans lequel plusieurs types d’informations interagissent de façon dyna- mique tout au long du temps pour former une représentation unifiée [9]. Les premières informations disponibles sont grossières puis s’affinent à mesure que l’information re- monte la hiérarchie des aires corticales, définissant ce que certains ont appelé l’hypothèse de l’analyse "coarse-to-fine", de la simple détection faciale à la reconnaissance fine des émotions [9].