© Marie-Hélène Tessier, 2018
Décours temporel de l'expression faciale dynamique de
la douleur à l'aide d'avatars virtuels
Mémoire
Marie-Hélène Tessier
Maîtrise en psychologie - avec mémoire
Maître ès arts (M.A.)
Décours temporel de l’expression faciale dynamique de la
douleur à l’aide d’avatars virtuels
Mémoire
Marie-Hélène Tessier
Sous la direction de :
Résumé
L’informatique affective vise à développer des systèmes informatiques capables de reconnaître et de recréer en réalité virtuelle certains états internes de l’humain. La douleur est un de ces états internes qui est décrit comme une expérience subjective à la fois sensorielle et affective. Pour communiquer aux autres notre douleur, les expressions faciales sont un moyen adaptatif. Si la composition en termes de mouvements faciaux est bien connue pour la douleur, le décours temporel de ces mouvements a peu été abordé. L’objectif du mémoire est de comparer le niveau de réalisme de différents décours temporels de l’expression faciale de la douleur chez des avatars et d’évaluer leur effet sur la douleur observée. Une étude empirique a été réalisée auprès de 45 adultes (22 femmes). Six ordres d’apparition de mouvements faciaux de la douleur et une apparition synchronisée ont été présentés aux participants par le biais de quatre avatars (deux femmes). Les participants ont jugé le niveau de réalisme des mouvements faciaux, ainsi que l’intensité et le niveau de désagrément de la douleur. Les résultats révèlent que les expressions de douleur sont perçues comme plus réalistes lorsque les mouvements autour des yeux apparaissent avant ceux autour du nez et de la bouche, comme plus intensément douloureuses lorsque les mouvements des sourcils sont les derniers à apparaître, et avec un niveau de désagrément plus élevé lorsque les mouvements autour du nez et de la bouche apparaissent avant ceux des sourcils. La séquence « Yeux, Nez/Bouche et Sourcils » était la seule qui était perçue comme étant la plus élevée au niveau du réalisme et de la douleur. Ce mémoire soulève l’importance de l’ordre d’apparition des mouvements faciaux dans la perception d’expressions de douleur, contribuant ainsi à l’avancement des connaissances sur le décodage et la production d’expressions de douleur en réalité virtuelle.
Abstract
Affective computing aims to develop computer-based systems that can recognize and recreate some human internal states through virtual reality. Pain is one such internal states described as both a sensory and an affective subjective experience. To communicate our pain to others, facial expressions are an adaptive mean. Although the still pain facial expression is well defined, the sequential order of movements that compose it has rarely been addressed in research. The objective of this thesis is to compare the various levels of realism as well as pain intensity and unpleasantness level attributed to different sequential orders of avatars’ facial expressions of pain. An empirical study has been conducted with 45 adults (22 women), who rated seven orders of appearance of different facial pain movements (six sequences and one synchronized apparition) of four avatars (two women). The results showed that pain expressions were perceived: 1) as more realistic when the eye-related movements appeared before the nose- and mouth- related movements; 2) as more intensely painful when brows-related movements were the last to appear; 3) as depicting higher unpleasantness level when the nose- and mouth-related movements appeared before the brows-related movements. In fact, the sequence “Eyes, Nose/Mouth, Brows” was the only one that was perceived as the highest on both realism and pain level. The results of this study raise the importance of the order of appearance of facial movements in the perception of pain expressions. Thus, this thesis contributes to the field of affective computing through the advancement of knowledge on decoding and producing pain expressions in virtual reality.
Table des matières
RÉSUMÉ ... III ABSTRACT ... IV TABLE DES MATIÈRES ... V LISTE DES TABLEAUX ... VII LISTE DES FIGURES ... VIII LISTE DES ABRÉVIATIONS ET DES SIGLES ... IX REMERCIEMENTS ... X AVANT-PROPOS ... XII
CHAPITRE 1. INTRODUCTION GÉNÉRALE ... 1
LA DOULEUR, UN CONCEPT MULTIDIMENSIONNEL AUTANT SENSORIEL QU’AFFECTIF ... 2
L’EXPRESSION FACIALE DE LA DOULEUR... 4
Son utilité et ses fonctions. ... 4
Sa composition et sa distinction des autres expressions. ... 5
Son décodage par des observateurs. ... 8
LE DYNAMISME DES EXPRESSIONS FACIALES ... 10
LES DÉCOURS TEMPORELS OBSERVÉS D’EXPRESSIONS FACIALES SPONTANÉES DE DOULEUR ... 13
L’ÉTUDE DU DÉCOURS TEMPOREL À L’ÈRE DU NUMÉRIQUE ... 13
Décoder les expressions faciales grâce à l’apprentissage automatique. ... 14
Reproduire les expressions faciales grâce à des agents virtuels. ... 15
Évaluer le réalisme des mouvements des avatars : Phénomène de l’Uncanny Valley. ... 17
DEUX THÉORIES DES ÉMOTIONS POUR DÉCRIRE LE DÉCOURS TEMPOREL DES EXPRESSIONS FACIALES ... 19
Théorie des émotions de base. ... 19
Théorie de l’évaluation cognitive (appraisal) de l’émotion. ... 19
COMPARAISON DE L’APPARITION SYNCHRONISÉE ET SÉQUENTIELLE DES MOUVEMENTS FACIAUX ... 20
PROBLÉMATIQUE ... 22
OBJECTIFS DU MÉMOIRE ... 23
CHAPITRE 2. ARTICLE ... 25
TOWARD DYNAMIC PAIN EXPRESSIONS IN AVATARS: PERCEIVED REALISM AND PAIN LEVEL OF DIFFERENT ACTION UNIT ORDERS ... 25
RÉSUMÉ DE L’ARTICLE ... 26
ABSTRACT ... 27
KEYWORDS ... 27
HIGHLIGHTS ... 27
1. INTRODUCTION ... 28
1.1. Facial expression of pain. ... 28
1.2. Observers’ characteristics and bias influencing the decoding of facial expressions of pain. 29 1.3. Dynamism of the facial expression of pain. ... 30
1.4. Two hypotheses to describe the dynamism of the facial expression of pain. ... 31
1.6. The comparison of the synchronized and sequential hypothesis of facial movements using
avatars. ... 32
1.7. The present research. ... 32
2.METHOD ... 33
2.1. Participants. ... 33
2.2. Stimuli and measures... 33
2.3. Procedure. ... 39
3.ANALYSES AND RESULTS ... 41
3.1. Preprocessing and preliminary analyses. ... 41
3.2. Mixed ANOVAs on Realism, Intensity and Unpleasantness of pain. ... 43
3.3. Cluster analysis of dynamic facial expressions. ... 49
3.4. Correlations between PCS, IRI, Realism and Pain perception according to the sex of the participant. ... 49
4.DISCUSSION ... 50
4.1. Order of AUs in the facial expression of pain. ... 50
4.2. Effect of observer’s sex and avatar’s gender on realism and pain perception. ... 54
4.3. Association between observers’ characteristics, realism and pain perception. ... 55
4.4. Limitations. ... 56
5. CONCLUSION ... 57
ACKNOWLEDGMENTS ... 57
DECLARATION OF INTEREST ... 57
REFERENCES ... 58
CHAPITRE 3. CONCLUSION GÉNÉRALE ... 66
RETOUR SUR LES OBJECTIFS DU MÉMOIRE ET LES PRINCIPAUX RÉSULTATS ... 66
Objectif 1 : Le réalisme. ... 66
Objectif 2 : La perception de la douleur... 67
Objectif secondaire 1 : Le sexe de l’observateur et le genre de l’avatar. ... 68
Objectif secondaire 2 : Les caractéristiques personnelles de l’observateur. ... 69
IMPLICATIONS POSSIBLES DES RÉSULTATS ... 70
BIBLIOGRAPHIE ... 74
ANNEXES ... 87
ANNEXE A : MODÈLE DE COMMUNICATION SOCIALE DE LA DOULEUR ... 87
ANNEXE B :PRÉDICTION DES AUS POUR CINQ ÉMOTIONS SELON UN MODÈLE DE LA THÉORIE DE L’ÉVALUATION COGNITIVE ... 88
ANNEXE C : EXEMPLE DU MODÈLE DES PROCESSUS COMPOSANTS POUR L’EXPRESSION FACIALE DE TRISTESSE ... 89
ANNEXE D : ÉTUDE PRÉLIMINAIRE SUR UNE BANQUE DE DONNÉES D’EXPRESSIONS FACIALES DE DOULEUR SPONTANÉES ... 90
ANNEXE E :QUESTIONNAIRE DE L’ÉCHELLE DES PENSÉES CATASTROPHIQUES (PCS) ... 97
ANNEXE F :QUESTIONNAIRE DE L’INTERPERSONAL REACTIVITY INDEX (IRI) ... 98
ANNEXE G : QUESTIONNAIRE SUR LES EXPÉRIENCES AVEC LES JEUX VIDÉO ET LES FILMS/SÉRIES D’ANIMATION ... 100
Liste des tableaux
TABLEAU 1 : RÉSUMÉ DES UNITÉS D’ACTION (AUS) COMPOSANT L’EXPRESSION FACIALE PROTOTYPIQUE DE
DOULEUR ... 6
TABLE 2 :SOCIO-DEMOGRAPHIC INFORMATION AND MEAN RESPONSES OR FREQUENCIES ON THE COMPUTER TASK AND QUESTIONNAIRES ... 42
Liste des figures
FIGURE 1. MODÈLE CIRCULAIRE DE LA DOULEUR ... 3
FIGURE 2. NOMBRE D’ARTICLES ASSOCIÉS AU DOMAINE DE LA RÉALITÉ VIRTUELLE (1990-2017) ... 16
FIGURE 3.GRAPHIQUE DE L’UNCANNY VALLEY ... 18
FIGURE 4. THE PHYSICAL APPEARANCE OF THE FOUR AVATARS ... 34
FIGURE 5. DESCRIPTION OF THE TIMING OF THE SIX SEQUENTIAL AND THE SYNCHRONIZED AUS ONSETS ... 35
FIGURE 6.TIMING OF SEQUENTIAL AND SYNCHRONIZED SETS OF AUS ONSETS, APEXES AND OFFSETS ... 37
FIGURE 7. DESIGN OF THE COMPUTER TASK OF THE STUDY ... 40
FIGURE 8. EFFECT OF SEQUENTIAL OR SYNCHRONIZED ONSET OF AUS SETS ON THE MEAN SCORE OF REALISM ... 44
FIGURE 9. INTERACTION EFFECT OF SEQUENTIAL OR SYNCHRONIZED ONSET OF AUS SETS FOR MALE AND FEMALE AVATARS ON MEAN SCORE OF REALISM ... 45
FIGURE 10.EFFECT OF SEQUENTIAL OR SYNCHRONIZED ONSET OF AUS SETS ON THE MEAN SCORE OF PAIN INTENSITY ... 46
FIGURE 11.EFFECT OF SEQUENTIAL OR SYNCHRONIZED ONSET OF AUS SETS ON THE MEAN SCORE OF PAIN UNPLEASANTNESS ... 47
FIGURE 12. INTERACTION EFFECT OF SEQUENTIAL OR SYNCHRONIZED ONSET OF AUS SETS FOR MALE AND FEMALE AVATARS ON MEAN SCORE OF PAIN UNPLEASANTNESS ... 48
Liste des abréviations et des sigles
FACS Facial Action Coding System AU (s) Unité(s) d’action (Action Unit(s))
Remerciements
Tout d’abord, j’aimerais remercier pour son soutien indéfectible et ses sages commentaires mon directeur de recherche et Maître Jedi, Philip (L.) Jackson. Merci Philip de m’avoir soutenu dans mon projet de recherche et d’avoir accepté de poursuivre mon évolution vers le titre de Chevalier Jedi, soit le Ph. D. Transmettre la Force de la recherche à de jeunes Padawans n’est pas une mince affaire, mais, Philip, tu es un de ces Jedi qui sont capables de susciter le meilleur de ces étudiant(e)s. Un énorme merci à tous mes collègues et ex-collègues du Laboratoire de neurosciences cognitives et sociales qui m’ont soutenue dans ce périple qu’est la maîtrise : Marie-Pier, Frédéric, Aurore, Alexis, Nicolas, Elsa, Michaël, Laetitia, Marie-France et tous ceux que j’oublie en ce dimanche après-midi. Un merci particulier à Sarah-Maude, l’ange gardien du labo, Josiane, mon mentor de Recherche Dirigée et guide spirituel, à ma voisine de bureau, Chloé alias Jolteon, qui est toujours là pour m’insulter amicalement, et à toute l’équipe EEVEE dont Audrey alias Flareon tignasse de feu et Camille alias Leafeon. Merci également à Luis Garcia-Larrea, Florian Chouchou et à tous les membres du Laboratoire Neuropain à Lyon de m’avoir accueilli durant mon stage de maîtrise, et d’avoir essayé de comprendre mon accent de Québécoise.
Merci au support de l’Université Laval et des centres de recherche où j’ai travaillé pendant de longues heures, le CIRRIS et le CERVO. Mes remerciements les plus sincères à un être supérieur qui offre le meilleur et le plus amical support informatique et technique du CIRRIS et de la galaxie : Nicolas. Merci pour tout ton travail acharné avec EEVEE.
Un merci spécial à tous mes professeurs qui m’ont donné le goût d’apprendre et m’ont encouragée à satisfaire ma curiosité insatiable. Plus particulièrement, j’aimerais remercier Pascale qui m’a initiée à la recherche et qui m’a surtout fait confiance en m’engageant comme auxiliaire de recherche lorsque j’étais une très jeune étudiante. J’espère vieillir (peut-être un jour à tes yeux) en suivant tes traces. J’aimerais remercier du plus profond de mon cœur tous mes amis et ma famille qui ont été toujours là pour moi. Merci à Michel, Marie, Simon, Jennifer, Florence, Antoine, Eugénie, Claudia, Laurence, Philippe, Raphaël, Alisé, Ivana, Koichi… Et tous ceux que j’oublie encore! Être entouré de personnes aussi exceptionnelles qui me soutiennent dans mes rêves les plus fous est ce qui me fait grandir chaque jour.
Merci maman de m’avoir transmis ta passion des défis. Avec une mère qui trouve que « Hambourg et Amsterdam en vélo, c’est bien beau, mais il manque de côtes », je ne crois pas que mon défi que je me suis donnée d’obtenir un Ph. D. tient du voisin…
Merci papa de m’avoir transmis la valeur la plus chère à tes yeux, l’ouverture aux autres, et de m’avoir soutenu dans ma phase des « Pourquoi? » qui ne s’est jamais vraiment arrêtée depuis mes 3 ans… Ironiquement, je ne crois que tu pensais que ça me mènerait à faire de la recherche en psychologie ;) Merci à mon super grand frère qui me fait toujours bien rire et partage avec moi la passion des nouvelles technologies et des animés japonais. Merci de m’avoir construit des maisons dans les Sims dans notre jeune temps pour que je me concentre très précocement sur un de mes intérêts actuels de recherche, les personnages virtuels.
Finalement, ce mémoire n’aurait pas vu le jour sans l’amour inconditionnel des deux hommes de ma vie :
Merci au chat Auguste Gustave l’Illustre, le Baron de la litière, qui, au cours des dernières années, m’a réveillée trop tôt le matin, m’a fait nettoyer ses petits « cadeaux » tous les matins, m’a fait ramasser ses dégâts digestifs et urinaires sur le plancher, m’a griffée, m’a attaquée pour aucune raison, mais surtout, m’a donné le sourire chaque jour ☺
Merci à mon coco, la douce moitié de ma vie. Tu es toujours là pour moi et tu es toujours prêt pour me suivre dans mes folies intellectuelles et mes voyages à l’autre bout du monde. Une maîtrise ne se fait pas tout seule et avoir quelqu’un à qui nous confier et, surtout, nous faire décrocher (!) fait partie des choses essentielles pour survivre aux études supérieures. Ce mémoire est aussi le fruit de tes efforts et je ne pourrais jamais de remercier assez pour tout ton amour et ta compréhension.
Je souhaite aussi remercier les organismes subventionnaires qui m’ont donné l’appui financier nécessaire pour compléter ma maîtrise : le Conseil de recherches en sciences naturelles et génie du Canada (CRSNG) et les Fonds de recherche du Québec — Nature et technologies (FRQNT).
Avant-propos
Ce mémoire décrit les différentes sections d’une étude sur le dynamisme de l’expression faciale de la douleur à l’aide d’avatars. Le mémoire contient, tout d’abord, une introduction générale qui développe le contexte théorique soutenant la question de recherche de l’étude. Par la suite, un article soumis intitulé « Toward dynamic pain expressions in avatars : Realism and pain level perceived of different action unit orders » y est inséré. Finalement, le mémoire contient une conclusion générale qui approfondit plus en détail les résultats de l’étude et leurs implications. Ce mémoire de maîtrise a été rédigé par Marie-Hélène Tessier sous la supervision de son directeur de recherche, le Pr Philip L.
Jackson.
Au moment du dépôt du mémoire, l’article inséré dans ce mémoire est a été soumis le 28 septembre 2018 à la revue scientifique Computers in Human Behavior. Les coauteurs de l’article ont contribué à la totalité ou à certaines étapes de l’étude. Premièrement, Philip L. Jackson, Ph. D., professeur titulaire à l’École de Psychologie de l’Université Laval, a supervisé l’ensemble des étapes du projet de recherche et a contribué à la révision de l’article. Ensuite, Chloé Gingras, B. A., étudiante au doctorat en psychologie R. I. à l’Université Laval, a participé au recrutement de participants et a aidé à la révision de l’article. Enfin, Nicolas Robitaille, Ph. D., ing., Ingénieur de recherche et coordonnateur au soutien technique au Centre interdisciplinaire de recherche en réadaptation et intégration sociale (CIRRIS), a élaboré les avatars utilisés dans l’étude.
Marie-Hélène Tessier est l’auteure principale de l’article inséré dans ce mémoire. Son rôle dans la préparation de l’article a été de réaliser l’ensemble des étapes de la conception, à la réalisation et à la publication d’une étude. Plus précisément, elle a conçu la question de recherche, effectué le relevé de littérature, obtenu l’approbation du comité éthique de l’Université Laval pour mettre en branle le projet, conçu la tâche informatique de l’étude, réalisé le recrutement de sujets humains, récolté les données lors de la passation des tests et questionnaires, effectué les analyses statistiques, interprété les résultats obtenus et, finalement, rédigé l’article.
Chapitre 1. Introduction générale
Vous écoutez le dernier épisode de votre émission favorite. Votre personnage ouvre enfin la porte de la fameuse cave qui détient tous les secrets de l’histoire. L’accent est sur le visage du personnage qui, au ralenti, fronce les sourcils, se retrousse la lèvre… Tout à coup, l’écran s’éteint. Grâce à la très grande amabilité de votre chat qui a arraché le fil de votre télévision dans un instant de folie, vous manquez les dernières secondes de votre épisode. Votre personnage est-il effrayé par la vue des outils de torture terrifiants? Ou est-il plutôt dégoûté de retrouver des cadavres démembrés dans cette mystérieuse cave? Après avoir disputé gentiment votre chat, vous rebranchez votre télévision et vous reprenez votre écoute. Le visage du personnage se crispe encore plus : les yeux se plissent et se ferment, des plis sur le nez apparaissent. Vous comprenez enfin grâce aux mouvements subtils des muscles du visage : votre personnage préféré exprime de la douleur. On voit, par la suite, le manche d’un poignard qui sort de son dos…
Cette situation de la vie quotidienne (décoder des expressions faciales, et non se retrouver dans une salle de torture, bien sûr) montre comment chaque instant, de l’ordre de quelques millisecondes, compte pour bien inférer l’état interne d’une personne par l’expression de son visage. Les expressions faciales sont des mouvements faciaux qui participent à la communication non verbale et, pour certaines d’entre elles, sont porteuses de sens, tel que la douleur ressentie par une personne. Contrairement à la compréhension de l’histoire de votre série préférée, bien percevoir la douleur chez autrui est vital considérant, entre autres, les impacts néfastes qu’un mauvais jugement chez un professionnel de la santé sur la présence et sur l’intensité de la douleur pourrait avoir chez un patient en souffrance. Par exemple, sous-estimer la douleur pourrait mener à de la frustration chez le patient qui ne se sent pas compris, ou pourrait signifier que certaines lésions ne sont pas identifiées et les soins appropriés ne pourraient être administrés, ce qui peut diminuer la qualité de vie du patient jusqu’à mettre sa vie en jeu (Prkachin, Solomon, & Ross, 2007). Au contraire, surestimer la douleur pourrait mener à la prescription d’antalgiques à haut risque de dépendance et aux effets secondaires sévères (p. ex., les opioïdes). C’est pour trouver un certain équilibre entre ces deux extrêmes que des regroupements nationaux de chercheurs et cliniciens en douleur ont fait la récente recommandation d’éviter ou d’ajuster au plus bas niveau possible la prescription d’antalgiques selon le niveau de douleur ressentie des patients, nécessitant ainsi une juste évaluation de la douleur des patients par les professionnels de la santé (Busse et al., 2017; Dowell, Haegerich, & Chou, 2016; Puntillo & Naidu, 2017).
Cependant, plusieurs études ont rapporté un faible taux de succès pour distinguer la douleur authentique de la douleur simulée par des expressions faciales chez des observateurs, autant chez ceux naïfs ou entraînés à discriminer les deux types d’expressions (Bartlett, Littlewort, Frank, & Lee, 2014; Hadjistavropoulos, Craig, Hadjistavropoulos, & Poole, 1996; Littlewort, Bartlett, & Lee, 2009; Poole & Craig, 1992). En effet, à cause de la présence de certains biais sociaux (p. ex., sur le genre, l’ethnie, le niveau socio-économique, etc.), puis des limites inhérentes de l’humain pour mesurer objectivement la rapidité, la durée ou l’intensité de mouvements, l’évaluation de la douleur chez autrui par la simple observation n’est pas toujours valide et fidèle parmi les observateurs.
Afin de surpasser ces limites dans l’évaluation de la douleur, l’arrivée récente de l’Affective
Computing (l’informatique affective en français) comme discipline scientifique, qui émerge des liens
créés entre l’informatique et l’étude des émotions, pourrait faire partie de la solution (voir, entre autres, D’Mello, Kappas, & Gratch, 2018). Dans le contexte des expressions faciales, cette discipline vise principalement deux buts (Scherer, 2010) : (a) la reconnaissance automatique des expressions faciales d’émotions, et (b) la production d’expressions émotionnelles par des agents artificiels intelligents. Grâce à l’utilisation des dernières technologies en apprentissage automatique, en graphisme et en animation 3D, il est possible d’explorer des aspects encore peu étudiés des expressions faciales permettant la meilleure reconnaissance et reproduction de celles-ci. Un de ces aspects toujours inexplorés est le décours temporel.
Par une des approches de l’informatique affective, soit la reproduction d’expressions faciales par des avatars, ce mémoire s’intéressera au décours temporel de l’expression faciale de douleur et, plus particulièrement, de son effet sur le décodage de la douleur et sur le réalisme.
La douleur, un concept multidimensionnel autant sensoriel qu’affectif
La douleur est définie comme une « expérience subjective sensorielle et émotionnellement désagréable résultant d’une lésion tissulaire réelle ou potentielle ou décrite en de tels termes » (IASP, 1994; traduit par Marchand, 2009, p. 20). Selon le modèle circulaire de la douleur (Marchand, 2009), elle est divisée en quatre composantes (voir Figure 1) : nociceptive, sensori-discriminative, motivo-affective et cognitivo-comportementale. La nociception consiste en la seule activation des fibres nociceptives. Les composantes sensori-discriminative et motivo-affective ont été identifiées dans la littérature comme les dimensions sensorielle et affective de la douleur (p. ex., Kunz, Lautenbacher, Leblanc, & Rainville, 2012; Rainville, Duncan, Price, Carrier, & Bushnell, 1997). La composante
sensori-discriminative consiste en la perception de la localisation, de la qualité et de l’intensité de la douleur tandis que la composante motivo-affective fait appel à l’aspect désagréable inhérent à la douleur et aux émotions reliées aux implications futures (Melzack & Casey, 1968). La dernière composante est celle cognitivo-comportementale qui correspond à l’expression verbale ou non verbale de douleur. Les composantes nociceptive, sensorielle, affective et comportementale du modèle circulaire de la douleur se distinguent les unes des autres. Cependant, elles coexistent dans un même événement de douleur et s’influencent mutuellement (Marchand, 2009). Par exemple, dans le cas de certaines douleurs chroniques, le patient peut souffrir et exprimer sa douleur lorsque l’activation nociceptive a disparu. L’augmentation de l’intensité de la douleur peut, par la suite, augmenter l’aspect désagréable de la douleur et la souffrance du patient. Celui-ci peut finalement exprimer cette douleur par des comportements, communiquant ainsi sa douleur aux autres. Dans le contexte médical, les comportements non-verbaux sont particulièrement d’intérêt puisqu’ils peuvent être une source riche d’information sur la douleur et un moyen accessible et utile afin de mesurer la douleur (Hadjistavropoulos & Craig, 2002).
Figure 1. Modèle circulaire de la douleur. Figure récupérée dans Marchand (2009), p.17.
Modèle circulaire de la douleur illustrant les composantes de la douleur et leurs interrelations.
L’expression faciale de la douleur
Son utilité et ses fonctions.Les expressions faciales, qui correspondent aux mouvements ou à la position des muscles sous la peau du visage, sont une forme de comportements non-verbaux. Plusieurs raisons expliquent pourquoi il y a un intérêt pour les expressions faciales dans l’étude de la douleur. Tout d’abord, autant dans le contexte médical que dans la vie de tous les jours, les observateurs accorderaient une plus grande crédibilité aux comportements non-verbaux, comme les expressions faciales, qu’aux mesures auto-rapportées pour juger de la douleur d’autrui (Craig, 1992; Poole & Craig, 1992; Williams, 2002). Cette tendance vers les comportements non-verbaux proviendrait de la croyance qu’il est plus difficile de simuler de la douleur par les comportements que par les mesures subjectives. De plus, chez certaines populations, par exemple les individus atteints de démence ou chez les enfants, l’accessibilité à l’aide de mesures auto-rapportées à la douleur ressentie de la personne souffrante est limitée par la confusion ou la difficulté à s’exprimer, ce qui place les comportements non-verbaux comme moyen privilégié d’atteindre l’état interne d’autrui (Herr, Coyne, McCaffery, Manworren, & Merkel, 2011). Les expressions faciales sont autant une source d’informations complémentaires qu’unique aux mesures verbales de l’expérience de la douleur.
Les expressions faciales permettent de s’adapter au monde social et de communiquer aux autres nos états internes. Elles sont un moyen puissant dans les interactions sociales de faire facilement et rapidement des inférences sur l’identité, le genre, l’état affectif tel la douleur ou le plaisir, etc. (Jack & Schyns, 2015). Selon une perspective comportementale et écologique des expressions faciales, celles-ci seraient des outils flexibles pour influencer l’environnement social et provoquer des changements d’action chez autrui (Crivelli & Fridlund, 2018). Selon Williams (2002), le fait de rester vigilant aux indices de douleur chez les autres favorise un partage d’information entre l’observateur et la personne souffrante (altruisme réciproque) tandis que, pour la personne en douleur, exprimer sa douleur permet de solliciter l’aide potentiel d’un autre individu. La communication de la douleur par les expressions faciales a donc le potentiel de déclencher de l’empathie et des comportements d’aide chez autrui favorisant, de ce fait, les interactions sociales (Goubert et al., 2005).
Les expressions faciales offrent également une valeur adaptative pour tant la survie et la sécurité de l’espèce humaine que celles d’un individu. Il a été proposé que la valeur adaptative des expressions faciales est de moduler l’accessibilité aux organes sensoriels du visage pour se préparer ou se protéger
du danger (Susskind et al., 2008; Susskind & Anderson, 2008). Par exemple, les mouvements faciaux composant l’expression de la peur (comme l’ouverture des yeux) permettraient d’augmenter l’exposition aux sens pour aider à la préparation au danger tandis qu’à l’opposé, les mouvements faciaux composant l’expression de dégoût (comme le froncement du nez), présents également dans l’expression de douleur, permettraient de diminuer l’exposition des sens pour se protéger du danger. Parmi les autres mouvements faciaux présents dans l’expression faciale de la douleur, la contraction des yeux pourrait également jouer un rôle dans la protection et l’humidification des yeux face à un danger (Craig, Prkachin, & Grunau, 2010). L’ontogenèse (des nouveau-nés aux personnes âgées; Prkachin, 2009) et la phylogenèse (chez les rats, Langford et al., 2010; les chats, Holden et al., 2014; les moutons, Häger et al., 2017; les furets, Reijgwart et al., 2017, etc.) de l’expression faciale de la douleur témoignent de son caractère adaptatif (Chambers & Mogil, 2015). Ainsi, dans une perspective évolutionniste, l’expression de la douleur offrirait une des meilleures protections pour notre survie en tant qu’espèce et qu’individu. La douleur permettrait de distinguer les situations nuisibles d’autres inoffensives, de promouvoir l’évitement de préjudices, de favoriser la fuite du danger et de promouvoir la guérison en inhibant les autres activités qui peuvent endommager encore plus les tissus (Williams, 2002). De plus, l’expression de douleur serait détectée plus rapidement que le genre, ce qui offre un appui au rôle de la douleur comme signal de danger (Czekala, Mauguière, Mazza, Jackson, & Frot, 2015). En somme, les différentes expressions faciales, plus particulièrement celle de la douleur, ont une fonction sociale (p. ex., demander de l’aide) et une autre adaptative (p. ex., signaler un danger) qui informent les autres de l’état interne d’une personne.
Sa composition et sa distinction des autres expressions.
Il existe plusieurs techniques pour décrire et mesurer les expressions faciales. La plus utilisée est le Facial Action Coding System ou FACS (Ekman & Friesen, 1978; Ekman, Friesen & Hager, 2002) à cause de l’exhaustivité de sa méthode et de sa rigueur psychométrique (Cohn & Ekman, 2005). Ce système athéorique décompose les expressions faciales en Unités d’action ou Action Units (AUs), soit les plus petits mouvements du visage pouvant visuellement être discriminés et étant associés à la contraction ou la relaxation de certains muscles du visage (Cohn, Ambadar, & Ekman, 2007). Le FACS est constitué de 46 AUs qui permettent de décrire n’importe quelle expression faciale, qu’elle soit associée ou non à un état interne, comme des émotions ou de la douleur. Une intensité est attribuée pour la plupart des AUs sur une échelle de 1 (0 % ; trace sur le visage) à 5 (100 % ; contraction maximale des muscles du visage), exprimée par les lettres A à E dans le manuel du FACS. Certaines
AUs, comme la fermeture des yeux, ont plutôt un système de codification binaire, soit la présence ou l’absence de l’action.
Selon le FACS, certaines configurations d’AUs ont été associées à certains états internes. Par exemple, le sourire de Duchenne, soit l’activation de l’AU 6 et l’AU 12, a été associé à de la joie authentique (Ekman, 1990; Ekman, Davidson, & Friesen, 1990). Dans le cas de la douleur, des AUs ont été identifiées comme transmettant l’essentiel de l’information sur la douleur disponible dans une expression faciale (Prkachin, 1992; Prkachin & Solomon, 2009). De ce fait, six AUs sont reconnues comme constituant l’expression faciale prototypique de la douleur (voir Tableau 1) : AU 4 (abaissement et rapprochement des sourcils), AU 6 (remontée des joues), AU 7 (tension des paupières), AU 9 (plissement de la peau du nez vers le haut), AU 10 (remontée de la partie supérieure de la lèvre) et AU 43 (fermeture des yeux). L’AU 6, l’AU 7 et l’AU 43 peuvent être regroupées en une seule action (resserrement des muscles de la région orbitaire et fermeture des yeux) puisque la forme et les bases musculaires de ces mouvements sont similaires. De même, l’AU 9 et l’AU 10 peuvent être combinées en une seule action (contraction du muscle levator labii superioris) parce qu’elles représentent différentes étapes du même mouvement musculaire.
Tableau 1
Ces trois regroupements de mouvements faciaux au cœur de l’expression de douleur (AU 4, AUs 6-7-43 et AUs 9-10) ont été retrouvés dans différentes modalités de stimulation nociceptives comme les chocs électriques, le froid, le bloc ischémique ou la pression (Prkachin, 1992). Récemment, ce patron d’AUs a été trouvé comme étant le plus fréquent chez des adultes en santé à la suite d’une analyse par grappes des AUs identifiées sur des segments de vidéos d’expressions faciales de douleur provoquées par des stimulations thermiques (Kunz & Lautenbacher, 2013). De plus, une étude suggère que les composantes sensori-discriminative et motivo-affective de la douleur sont encodées dans ce patron de mouvements faciaux et que chacune des composantes est associée à certaines AUs de ce patron (Kunz et al., 2012). De ce fait, la composante sensori-discriminative semble associée aux AU 6 et AU 7, celles-ci pouvant jouer un rôle dans la protection et l’humidification des yeux face à un danger (Craig et al., 2010). La composante motivo-affective semble plutôt associée aux AUs 4, 9 et 10, celles-ci étant également présentes dans l’expression d’autres états émotionnels désagréables comme le dégoût et la colère (Scherer & Ellgring, 2007). C’est pourquoi les AUs 4, 6-7, 9-10 et 43 sont considérées comme étant les mouvements faciaux de l’expression faciale prototypique de la douleur.
Par ailleurs, la combinaison de ces quatre mouvements faciaux est spécifique à l’expression de douleur. Dans une étude réalisée à l’aide de photos d’acteurs (Kappesser & Williams, 2002), la discrimination de l’expression faciale prototypique de la douleur parmi celles de six autres émotions négatives (peur, dégoût, tristesse, colère, surprise et embarras) avait un taux de succès de 58,8 % (correspondant au produit du taux de bonne identification de l’expression de douleur [70 %] avec le taux de bon rejet des autres expressions [84 %]). En revanche, malgré un niveau acceptable de reconnaissance de la douleur sur des photos, les participants étaient meilleurs pour identifier les autres émotions négatives (p. ex. la peur avec un taux de succès de 92 %) que la douleur. Cette faible performance pour la douleur était en particulier due au 18 % des participants de l’étude qui ont confondu l’expression de douleur avec celle de dégoût. Une raison qui a été suggérée pour expliquer la confusion entre la douleur et le dégoût est l’occurrence d’AUs communes entre les deux expressions faciales prototypiques, comme l’AU 9 et l’AU 10. En comparant l’expression faciale de douleur avec celle de peur, de dégoût, de tristesse, de colère, de surprise et de joie à l’aide de vidéos d’acteurs, Simon, Craig, Gosselin, Belin, et Rainville (2008) sont arrivés à un constat semblable, mais avec un niveau moindre de confusion entre l’expression de douleur et de dégoût. Les résultats de cette étude montrent un taux de succès de 71 % (correspondant au produit du taux de bonne identification de l’expression de douleur [74 %] avec le taux de bon rejet des autres expressions [96 %]) dans la
discrimination de l’expression prototypique de douleur parmi les autres émotions. Ce taux de succès équivalait à celui pour les autres émotions (p. ex. la peur avec un taux de succès de 72 %).
Une distinction particulièrement intéressante entre les deux précédentes études est le meilleur taux de succès dans la discrimination de la douleur dans l’étude de Simon et collaborateurs (2008), comparativement à l’étude de Kappesser et Williams (2002). Cette meilleure performance pourrait provenir de l’utilisation de vidéos d’acteurs de 1 seconde reproduisant les expressions faciales prototypiques dans l’étude de Simon et collaborateurs (2008), contrairement à l’utilisation de photos d’acteurs reproduisant les mêmes expressions dans l’étude de Kappesser et Williams (2002). Ainsi, la combinaison des résultats de ces deux études suggère que l’utilisation de vidéos plutôt que des photos améliore la discrimination de la douleur avec d’autres émotions négatives et qu’ainsi, une propriété de l’expression faciale de douleur présente dans les vidéos semble aider à la discrimination de la douleur des autres expressions. Enfin, il existe un consensus dans la composition en termes d’AUs de l’expression faciale de douleur qui correspond aux AUs 4, 6-7-43 et 9-10, mais la modalité de présentation de ces AUs, soit par des photos ou des vidéos, semble avoir un impact sur la discrimination de l’expression de douleur parmi d’autres expressions d’émotions négatives.
Son décodage par des observateurs.
L’expression faciale de la douleur s’inscrit dans un processus de communication de la douleur d’une personne souffrante à un ou des observateurs. Selon le modèle de communication sociale de la douleur, ce processus suit une chronologie passant par les antécédents à la douleur, l’expérience de la douleur et l’expression de la douleur chez la personne souffrante, puis le décodage de la douleur et l’action d’un observateur (Craig, 2015; Craig, 2009; voir Annexe A : Modèle de communication sociale de la douleur). Chacune de ces étapes est déterminée par des facteurs biologiques et sociaux qui sont intrapersonnels ou interpersonnels, et se déroule dans un certain contexte social, économique et physique. Ainsi, comme intérêt principal dans ce mémoire pour l’étude de la perception d’expressions faciales de douleur, certains facteurs intrapersonnels et interpersonnels de l’observateur pour le décodage de la douleur ont été abordés dans de précédentes études. Ceux-ci comprennent le sexe, le niveau de catastrophisation de la douleur et les habiletés empathiques de l’observateur, puis le genre de la personne en douleur.
Facteurs intrapersonnels de l’observateur : Sexe, catastrophisation de la douleur et habiletés empathiques.
Trois caractéristiques intrinsèques aux observateurs peuvent moduler la perception d’expressions faciales de douleur: le sexe, la catastrophisation de la douleur et les capacités empathiques. Premièrement, selon plusieurs études, les femmes sont meilleures et plus rapides pour détecter le sens émotionnel des comportements non-verbaux comme les expressions faciales (Babchuk, Hames, & Thompson, 1985; Hall, 1978; Hampson, Vananders, & Mullin, 2006; Rotter & Rotter, 1988; Thayer & Johnsen, 2000; Wingenbach, Ashwin, & Brosnan, 2018). Cependant, une étude a démontré que les hommes étaient meilleurs que les femmes pour détecter les expressions faciales de douleur authentiques de celles exagérées ou dissimulées (Ruben & Hall, 2013). De plus, dans la même étude, aucune association n’a été trouvée entre la performance à une tâche de reconnaissance des émotions et à la tâche de détection de douleur, suggérant le recrutement de différentes compétences dans le jugement de la douleur et celui des émotions. Ainsi, malgré le fait bien établi que les femmes ont une meilleure sensibilité non verbale pour les émotions que les hommes, cette différence entre les sexes ne semble pas aussi claire pour la douleur.
Deuxièmement, la catastrophisation de sa propre douleur pourrait affecter la perception de la douleur chez autrui. Elle est définie comme : « un ensemble de pensées négatives amenées à l’esprit durant l’expérience actuelle ou anticipée de la douleur » (Sullivan et al., 2001). Un niveau élevé de catastrophisation de la douleur a été associé à une douleur exprimée plus intense (Weissman-Fogel, Sprecher, & Pud, 2008), puis à une perception accrue de la douleur par des observateurs (Sullivan, Martel, Tripp, Savard, & Crombez, 2006). D’autres travaux ont également pu montrer qu’une amplification du biais attentionnel envers les stimuli présentant des informations sur la douleur, comme l’expression de douleur, est associée à un niveau plus élevé de catastrophisation de la douleur (Crombez, Eccleston, Baeyens, & Eelen, 1998; Crombez, Eccleston, Van Den Broeck, Van Houdenhove, & Goubert, 2002; Crombez, Van Ryckeghem, Eccleston, & Van Damme, 2013; Heathcote et al., 2015; Van Damme, Crombez, & Eccleston, 2004). Ainsi, la manière de gérer sa douleur semble influencer la manière de porter attention à la douleur des autres.
Troisièmement, les habiletés empathiques d’un observateur pourraient moduler sa représentation de la douleur d’autrui. L’empathie est définie comme : « la capacité de partager et de comprendre les émotions d’autrui sans confondre soi et les autres » (Decety & Jackson, 2004; Decety & Lamm, 2006). Il a été, entre autres, conceptualisé comme un trait multidimensionnel variant selon
les individus (p. ex., Davis, 1980, 1983; Lawrence, Shaw, Baker, Baron-Cohen, & David, 2004). Concernant la perception des expressions faciales, les individus avec un niveau élevé d’empathie portent plus d’attention aux visages humains, ceci étant mesuré à l’aide de l’électroencéphalographie et plus particulièrement le potentiel évoqué positif latent, lors d’une tâche de discrimination des expressions faciales de joie et de colère contrairement aux individus avec un faible niveau d’empathie (Choi & Watanuki, 2014). De plus, une meilleure discrimination entre les expressions de douleur authentiques, exagérées et dissimulées est associée à de plus grandes capacités empathiques (Ruben & Hall, 2013). Par conséquent, les capacités à se représenter et ressentir la douleur des autres pourraient affecter la façon dont les expressions de la douleur sont perçues par les hommes et les femmes.
Facteur interpersonnel de l’observateur : Genre de la cible.
Le genre de la cible est considéré comme un biais dans la perception d’expressions faciales de douleur. La douleur est, en générale, détectée plus rapidement, avec plus d’exactitude et est perçue avec une intensité et un désagrément plus élevés lorsqu’elle est détectée sur des visages d’hommes comparativement à ceux de femmes (Coll, Budell, Rainville, Decety, & Jackson, 2012; Pronina & Rule, 2014; Riva, Sacchi, Montali, & Frigerio, 2011; Simon, Craig, Miltner, & Rainville, 2006). Reflétant la croyance que les hommes sont perçus comme ressentant et exprimant moins de douleur (Robinson et al., 2001; Robinson, Gagnon, Riley, & Price, 2003; Robinson & Wise, 2003), il a été suggéré que, pour une intensité similaire, l’expression faciale de douleur chez les hommes serait perçue comme provenant d’un stimulus plus nocif et menaçant que celle des femmes. Néanmoins, quelques études utilisant une même technologie d’humains virtuels ont plutôt relevé que les expressions de douleur chez les femmes étaient perçues comme plus intenses et avec un niveau de désagrément plus élevé que chez les hommes (Hirsh, George, & Robinson, 2009; Stutts, Hirsh, George, & Robinson, 2010; Torres et al., 2013). En raison de ces précédents dans la littérature, on peut s’attendre à ce que le genre de la cible ait une influence sur la perception d’expressions de douleur.
Le dynamisme des expressions faciales
Un élément qui pourrait améliorer la reconnaissance de la douleur parmi les autres émotions et qui a très longtemps été négligé pour l’expression faciale de la douleur et des émotions est le dynamisme. On définit le dynamisme comme quelque chose en mouvement, qui est non fixe et qui s’oppose à tout ce qui est statique. Du point de vue méthodologique, les aspects dynamiques des
expressions faciales sont seulement présents dans les vidéos, et non dans les images et les photographies où seulement les caractéristiques statiques des expressions sont dépeintes. La recherche sur la perception et la reconnaissance de la douleur et des émotions a majoritairement abordé les expressions faciales intenses sous l’angle d’images statiques. Cependant, notre expérience du quotidien le prouve : les expressions faciales sont constituées de mouvements qui peuvent changer au cours du temps et qui peuvent parfois être de faible intensité. Dans le contexte d’interactions sociales, les humains sont en contact avec des visages dynamiques, et non des visages figés dans le temps, ce qui leur permet de distinguer, au fil du temps, différents états internes chez un même individu (p. ex., passer d’une expression neutre à l’expression d’une émotion).
Cette importance du dynamisme dans la reconnaissance d’états internes chez autrui a été plusieurs fois démontrée par la sensibilité des humains à distinguer certains aspects relatifs aux mouvements des expressions faciales d’émotions. De ce fait, le dynamisme des expressions faciales améliore l’identification et le jugement sur des émotions (Krumhuber, Kappas, & Manstead, 2013). De plus, les humains sont capables d’utiliser des indices du dynamisme d’une expression faciale pour reproduire la progression temporelle appropriée à un niveau au-delà de la chance (Edwards, 1998). De même, les humains auraient une préférence pour un certain déroulement dans l’expression faciale de peur. Les résultats de Reinl et Bartels (2015) ont montré qu’une expression de peur est perçue comme moins intense, moins convaincante et plus artificielle lorsque son apparition est présentée comme l’ordre chronologiquement inversé du relâchement de l’expression (c.-à-d. de l’expression neutre suite à la disparition de la peur à son intensité maximale) comparativement à l’ordre chronologiquement naturel de l’apparition de l’expression (c.-à-d. de l’expression neutre avant l’apparition de la peur à son intensité maximale). Ainsi, malgré un même point de départ et d’arrivée de l’expression de peur, l’ordre des mouvements dans l’apparition et du relâchement des mouvements semblent se distinguer. En outre, pour discriminer différents types de sourire, autant les caractéristiques morphologiques que dynamiques sont utilisées (Ambadar, Cohn, & Reed, 2009). Le moment d’apparition des AUs dans un sourire a également un effet sur la perception de l’authenticité, de l’attraction, de la dominance, de la confiance et du niveau de séduction d’un avatar virtuel (Krumhuber, Manstead, & Kappas, 2007). Le dynamisme aide également à distinguer une expression authentique d’une expression simulée (Cohn & Schmidt, 2004; Krumhuber & Kappas, 2005). De plus, la vitesse d’apparition des AUs dans une expression faciale influence la reconnaissance des émotions, cette influence étant différente de l’effet de la durée totale de présentation de l’expression (Kamachi et
al., 2001). Par exemple, les expressions faciales sont mieux perçues comme de la joie et de la surprise quand la vitesse est élevée, puis comme de la tristesse quand la vitesse est lente.
Dans le même ordre d’idées, le système perceptif humain serait sensible aux plus petits changements temporels et spatiaux des mouvements faciaux (Dobs et al., 2014). Dans cette étude, le résultat d’une capture de mouvements du visage a été comparé avec des approximations linéaires (interpolation linéaire à trois [lin1] ou quatre temps de contrôle [lin2]) et non linéaires (interpolation « spline » cubique à trois temps de contrôle [spl1] et interpolation « spline » cubique avec la méthode Hermine à quatre temps de contrôle [hspl]) de ces mêmes mouvements captés. Plus l’approximation était comparable à la reproduction des mouvements naturels (c.-à-d. que son activation au fil du temps s’apparentait à celui du mouvement naturel), plus les participants la jugeaient comme étant naturelle. Les participants ont été ainsi capables de hiérarchiser les approximations du plus au moins naturel (hspl > lin2 > lin1 = spl1), et sont donc sensibles à la quantité d’informations sur les mouvements naturels fournies par les approximations mathématiques. Toutefois, les résultats de l’étude permettent de nuancer que l’approximation perçue comme plus naturelle dépend de l’expression présentée (linéaire pour les expressions de peur, joie et surprise, comparativement à non linéaire pour l’expression de colère).
Par ailleurs, l’avantage du dynamisme par rapport au statisme n’est pas seulement dû à l’ajout d’informations statiques. En présentant des stimuli statiques, multistatiques (images de stimuli dynamiques séparées par des masques pour interrompre l’apparence de mouvements) et dynamiques d’expressions faciales d’émotions, le taux de reconnaissance est plus élevé pour les stimuli dynamiques (Ambadar, Schooler, & Cohn, 2005). Ce résultat suggère que les stimuli dynamiques sont une source unique d’information sur les mouvements qui n’est pas présente dans les images statiques, peu importe le nombre.
En conclusion, tous ces exemples appuient le fait que les humains sont sensibles aux changements dynamiques dans les expressions faciales et que le dynamisme contribue à la détection et à la discrimination des émotions. Cette variable a ainsi le potentiel d’influencer la reconnaissance automatique d’expressions faciales, ou encore la synthèse artificielle de ces expressions faciales. Toutefois, certaines études remettent en question cette avantage du dynamisme (Fiorentini & Viviani, 2011; Gold et al., 2013), puis seulement quelques études se sont concentrées à décrire le décours temporel pour l’expression faciale de douleur.
Les décours temporels observés d’expressions faciales spontanées de douleur
De premières études ont tenté de décrire le dynamisme naturel de l’expression faciale de douleur. Hill et Craig (2002) ont observé chez des patients souffrant de douleur lombaire que, lorsque l’expression faciale de la douleur était simulée, les AUs apparaissaient dans un ordre séquentiel avec un certain chevauchement tandis que, lorsque l’expression faciale de la douleur était authentique, les AUs apparaissaient environ en même temps (synchronisées). D’un autre côté, une autre étude aurait obtenu un constat différent. En effet, Prkachin et Mercer (1989) ont observé avec des vidéos de patients souffrant de douleur à l’épaule que le décours temporel de l’expression de douleur évoluerait de façon dépendante à la sévérité et à la durée de l’expérience. Ainsi, les auteurs ont pu observer cette séquence cumulative d’apparition des AUs reliées à la douleur (du haut au bas du visage), chaque étape représentant une intensité de douleur plus grande :
(a) Abaissement des sourcils (AU 4) et début du processus de fermeture des yeux
(b) Rétrécissement du muscle intérieur de la paupière (AU 7), fermeture du muscle orbital extérieur (AU 6) et fermeture totale des yeux (AU 43)
(c) Remontée de la lèvre supérieure (AU 10) et plissement du haut du nez (AU 9)
(d) Ouverture de la bouche (AUs 25-26-27) et, à l’extrême, à l’étirement horizontal des lèvres (AU 12)
En somme, les résultats des premières études d’observation du décours temporel de l’expression faciale de la douleur chez des patients sont succincts et ne permettent donc pas encore de conclure sur la prévalence d’un ou de plusieurs patrons temporels de l’expression faciale de la douleur.
L’étude du décours temporel à l’ère du numérique
Grâce à l’arrivée des récentes avancées technologiques en informatique, l’intérêt pour l’étude du dynamisme des expressions faciales s’est décuplé depuis une vingtaine d’années (comme vu dans la section du mémoire « Le dynamisme des expressions faciales »). Même si la plupart de ces études se sont penchées sur le dynamisme d’expression faciale d’émotions, certaines ont abordé le cas de la douleur. Les avantages qu’apportent ces nouvelles technologies pour l’étude du dynamisme de l’expression faciale de la douleur permettent de surpasser les limites présentes dans les précédentes études d’observation de visage de patients.
Décoder les expressions faciales grâce à l’apprentissage automatique.
Un des désavantages dans les précédentes études d’observation de visages en douleur est le codage manuel des AUs sur les visages des patients par des juges experts du FACS. En effet, même si le codage manuel du FACS est réalisé avec un accord interjuge élevé et comprend une procédure claire pour codifier les AUs (Cohn & Ekman, 2005), la codification manuelle est basée sur la perception (subjective) des mouvements faciaux des juges et comprend ainsi une certaine variabilité sur la présence ou l’intensité des mouvements entre les codeurs (Prkachin, 2009). De plus, puisque le codage manuel du FACS demande aux juges d’observer les expressions faciales d’image en image, il ne peut se faire en temps réel et demande une quantité d’effort et de temps très importante pour réaliser des analyses. Selon Prkachin (2009), pour chaque unité de temps d’observation (p. ex., 1 minute), le codage des mouvements faciaux requiert cent fois plus d’unités de temps (p. ex., 100 minutes).
C’est pour aller au-delà de ces limites humaines d’objectivité et de temps que les systèmes d’apprentissage automatique (Machine Learning Systems) ont commencé à être utilisés dans l’étude de la reconnaissance et du décodage des expressions faciales (voir Martinez, Valstar, Jiang, & Pantic (2017) pour une revue systématique sur le sujet). L’apprentissage automatique fait partie du champ des sciences informatiques, et plus spécifiquement de l’intelligence artificielle, et a pour but de créer des systèmes informatiques capables d’« apprendre » par eux-mêmes, c.-à-d. de s’améliorer dans une tâche spécifique, en présence d’une grande quantité de données (Big data). Les récentes découvertes en apprentissage automatique ajoutent de nouveaux outils pour l’étude du dynamisme par le décodage d’expressions faciales de douleur (p. ex., Aung et al., 2015; Bartlett et al., 2014; Hammal & Kunz, 2012; Littlewort et al., 2009; Lucey, Cohn, Matthews, et al., 2011; Siebers, Schmid, Seuß, Kunz, & Lautenbacher, 2016). Notamment, des algorithmes intégrant l’information temporelle des expressions de douleur ont permis d’atteindre un taux d’exactitude de 84,5 % pour reconnaître la douleur parmi les six émotions de base et le neutre (Hammal & Kunz, 2012), et un taux d’exactitude de 85 % pour discriminer la douleur authentique de la douleur simulée (Bartlett et al., 2014). Par conséquent, les algorithmes d’apprentissage automatique pourraient permettre d’extraire les décours temporels les plus fréquents, et ce, pour différentes populations (p. ex., selon le sexe, l’âge, l’ethnie, etc.).
Cependant, dans la perspective de créer des agents virtuels intelligents qui peuvent reconnaître et reproduire la douleur, les systèmes d’apprentissage automatique ne nous renseignent aucunement sur le contenu perceptif des différents paramètres du décours temporel (p. ex., l’ordre ou la vélocité
d’apparition des AUs, le temps total des AUs et de l’expression, etc.). Par exemple, ils ne permettent pas de conclure que tel décours temporel d’une expression faciale est jugé par un observateur externe comme une expression réaliste ou s’il est perçu comme une expression de douleur de forte intensité. Des études de perception sur les différents décours temporels pourraient donc contribuer à améliorer la reproduction d’expressions faciales de douleur.
Reproduire les expressions faciales grâce à des agents virtuels.
Pour en apprendre plus sur le point de vue de l’observateur concernant les différents décours temporels d’expressions faciales, la reproduction d’expressions par des acteurs a été un moyen privilégié (Gosselin, Kirouac, & Dore, 1995; Scherer & Bänziger, 2010). Avec ce paradigme, une étude a pu montrer que plus de douleur était perçue lorsque les AUs reliées à la douleur étaient exprimées par des acteurs de façon synchronisée, c’est-à-dire que le chevauchement des apex des AUs était complet, que de manière séquentielle, c’est-à-dire que les apex des AUs ne se chevauchaient pas (Lee, 1985). Malgré la grande utilité des acteurs dans les études de perception, les capacités restreintes des humains pour contrôler consciemment les muscles de leur visage limitent la reproduction fidèle d’une expression. Il existe une certaine variabilité interindividuelle dans l’expression spontanée de la douleur (p. ex., Kunz & Lautenbacher, 2013) et, malgré des instructions et un procédurier très étoffé donné aux acteurs (comme dans Simon et al., 2008), la reproduction d’un décours temporel déterminé d’une expression par des humains est presque impossible et peut être perçue comme une expression non authentique.
Après ses premiers développements dans le domaine du divertissement avec les films et les jeux vidéo, la réalité virtuelle s’est développée au cours des 30 dernières années dans le but de simuler, entre autres, les émotions et les interactions sociales (Riva et al., 2007). Par exemple, une simple consultation de la base de données bibliographiques SCOPUS montre l’augmentation croissante du nombre d’articles associés au domaine de la réalité virtuelle (voir Figure 2; Vergara, Rubio, & Lorenzo, 2017). La réalité virtuelle correspond à la création d’un monde généré par ordinateur où un utilisateur peut interagir avec une personne réelle ou virtuelle. Le principal avantage de la réalité virtuelle est d’être une solution idéale pour obtenir un niveau optimal de contrôle expérimental tout en gardant la validité écologique nécessaire pour l’étude de contextes sociaux complexes (Pan & Hamilton, 2018). De ce fait, contrairement à des acteurs humains, les visages humains créés artificiellement par
ordinateur ont l’avantage de pouvoir être facilement contrôlés selon la durée (en ms) et l’intensité (en %) de chaque mouvement facial tout en étant perçus avec un certain niveau de réalisme.
Figure 2. Courbes traçant le nombre croissant d’articles associés au domaine de la réalité virtuelle
(VR) entre 1990 et 2017. Graphique récupéré dans Vergara, Rubio et Lorenzo (2017).
Les avatars sont des représentations graphiques (2D ou 3D) de l’alter ego d’un utilisateur ou de personnages contrôlés par l’humain implémentées dans un environnement virtuel. Selon une étude sur la perception d’expressions faciales, les visages d’avatars étaient comparables à des visages naturels pour représenter différentes expressions faciales dynamiques qui pouvaient être jugées par leur nature émotionnelle ou leur intensité par des observateurs (Dyck et al., 2008). Ce constat est relié
au Media Equation Concept, ou l’Ethopoeia Concept, qui suggère une réaction semblable chez
humains à des comportements sociaux réalisés par des ordinateurs que par des humains, pour autant que les signaux sociaux de l’agent virtuel soient suffisamment développés (Nass & Moon, 2000). À la suite de cette théorie, plusieurs modèles faciaux d’avatars ont ainsi été créés à partir de paramètres pouvant être contrôlés sur la base du FACS du visage humain. C’est le cas, par exemple, des plateformes d’avatars FACSGen (Roesch et al., 2011) ou Environnement Évolutif Virtuel pour l’Étude de l’Empathie, EEVEE (Jackson, Michon, Geslin, Carignan, & Beaudoin, 2015). Avec ces outils, il est possible de changer au fil du temps l’intensité des mouvements possibles sur des visages virtuels qui reproduisent des visages humains. Ainsi, selon la concordance entre des visages artificiels et réels,
l’utilisation d’avatars aurait un apport potentiel pour l’étude du décours temporel de l’expression faciale de la douleur.
Évaluer le réalisme des mouvements des avatars : Phénomène de l’Uncanny Valley.
Le réalisme correspond au degré auquel un objet (comme une image ou un récit) correspond à la réalité (Malliet, 2006; Peschl & Riegler, 1999). S’il est intuitif de penser qu’il existe une relation linéaire entre le niveau de réalisme d’un avatar et le niveau d’affinité d’un observateur envers l’avatar, un chercheur japonais en robotique a plutôt proposé l’idée que cette relation serait non-linéaire et s’inverserait à un certain point lorsqu’un avatar ressemblerait à un humain sans y être identique (Mori, 1970). Ce point de chute dans l’affinité envers l’avatar est appelé l’Uncanny Valley, ou la « Vallée Dérangeante » (voir Figure 3). Ce phénomène serait présent pour n’importe quel objet possédant certaines caractéristiques humaines, dont les androïdes (Mathur & Reichling, 2016) et les visages humains artificiels (Seyama & Nagayama, 2007). La dimension du réalisme de l’Uncanny Valley (l’axe des abscisses sur la Figure 3) est définie comme le degré de ressemblance d’un objet à un réel humain (p. ex., du robot industriel en passant par une peluche, un corps humain sans vie jusqu’à un humain en santé), tandis que la dimension de l’affinité (l’axe des ordonnées sur la Figure 3) correspond au réalisme ou à la familiarité perçue de l’objet virtuel et la réaction émotionnelle (émotions positives à émotions négatives) provoquée par l’objet (Kätsyri, Förger, Mäkäräinen, & Takala, 2015). Par exemple, selon ce modèle, la prothèse de main qui atteint un haut degré de ressemblance avec l’apparence d’une main humaine, mais qui n’arrive pas à reproduire l’ensemble des propriétés humaines (p. ex., la température du corps ou la texture de la peau) se retrouve dans le creux de l’Uncanny Valley par l’impression étrange qu’elle peut susciter chez l’utilisateur et les autres.
Figure 3. Graphique qui montre la zone où l’affinité chute à un certain niveau de réalisme pour un
avatar, appelée l’Uncanny Valley (en gris). Figure récupérée dans Kätsyri, Förger, Mäkäräinen et Takala (2015).
Selon le modèle formulé par Mori (1970), un objet dynamique est considéré comme plus réaliste qu’un objet statique, mais l’ajout de mouvement a comme double tranchant d’augmenter la susceptibilité de trouver l’objet comme étrange et non humain en présence de mouvements perçus comme pas tout à fait réalistes (la ligne pointillée sur la Figure 3). En effet, de précédentes études ont rapporté cet apport important du réalisme des comportements dans l’interaction d’utilisateurs avec des agents virtuels (Groom et al., 2009; Von Der Pütten, Krämer, Gratch, & Kang, 2010). Ainsi, dans le but d’améliorer le réalisme perçu et diminuer le malaise envers un avatar, l’harmonisation du réalisme de l’apparence et des autres formes de réalisme, comme le réalisme comportemental, doit être recherchée. Pour ce qui est des expressions faciales d’avatars, les mouvements faciaux perçus comme réalistes par des observateurs méritent d’être davantage étudiés pour surmonter l’Uncanny
Williams, 2011; Tinwell, Grimshaw, & Williams, 2010). Ainsi, les décours temporels d’expressions faciales pourraient être comparés expérimentalement avec l’aide d’avatars pour évaluer leur réalisme.
Deux théories des émotions pour décrire le décours temporel des expressions
faciales
Deux théories sur les émotions ont prédit des types de décours temporel pour les expressions faciales qui peuvent expliquer l’avantage du dynamisme dans la reconnaissance et la discrimination des émotions (qui pourrait s’appliquer à l’expression faciale de douleur également) : (a) la Théorie des émotions de base, et (b) la Théorie de l’évaluation cognitive (appraisal) des émotions.
Théorie des émotions de base.
Cette théorie partage la perspective évolutionniste des émotions, ces dernières participant au processus d’adaptation (Coppin & Sander, 2010). Il y aurait donc un nombre limité d’émotions universelles avec un rôle adaptatif particulier pour chacune, mais des propriétés communes qui les différencient des autres états affectifs (Ekman, 1992). Ces familles d’émotions fondamentales s’appelleraient des émotions de bases ou discrètes. Chacune de ces émotions de base aurait un patron prototypique d’AUs (Ekman et al., 2002). Selon cette théorie, les expressions faciales d’émotions se déclencheraient intégralement par l’activation de programmes neuromoteurs. Les caractéristiques dynamiques seraient ainsi encodées avec l’information statique dans une même représentation mentale de l’expression faciale. Par conséquent, les AUs recrutées pour une expression faciale s’activeraient de façon synchronisée.
Théorie de l’évaluation cognitive (appraisal) de l’émotion.
La théorie de l’évaluation cognitive (appraisal) conceptualise les émotions comme un traitement cognitif de type évaluatif (Coppin & Sander, 2010). Ainsi, l’émotion représente la somme d’un processus plutôt que l’activation d’un état interne particulier. Face à un événement, un observateur évalue la situation selon certains critères comme la pertinence (l’évaluation de la nouveauté ou du caractère plaisant intrinsèque au stimulus), l’implication (le caractère prédictible, l’importance pour les buts et la cause du stimulus), le potentiel de maîtrise (la possibilité de gérer les conséquences de l’événement) et de la compatibilité avec les normes sociales ou personnelles (Ellsworth & Scherer, 2003). L’évaluation de ces critères se ferait de façon séquentielle et cumulative, des caractéristiques primitives du stimulus affectif à celles plus complexes. Les émotions se différencient selon le poids donné aux critères. Ce processus évaluatif serait inconscient et automatique. Selon cette théorie, les
expressions faciales seraient un reflet de ce processus évaluatif des émotions (voir Annexe B : Prédiction des AUs pour cinq émotions selon un modèle de la théorie de l’évaluation cognitive).
Comparaison de l’apparition synchronisée et séquentielle des mouvements
faciaux
À l’aide d’avatars, trois études se sont intéressées à la question de l’apparition synchronisée ou séquentielle des AUs dans les expressions faciales. Dans le domaine des émotions, Wehrle et collaborateurs (2000) ont comparé directement ces hypothèses dans une tâche de reconnaissance. Ils ont présenté des expressions faciales synthétisées ayant une séquence d’apparition des AUs prédite pour chaque émotion par un modèle d’évaluation cognitive des émotions, le modèle des processus composants ou MPC (Scherer, 1984, 1987; voir Annexe C : Exemple du Modèle des Processus Composants pour l’expression faciale de tristesse), ou ayant une apparition simultanée des AUs. Les participants devaient évaluer à l’aide d’échelles de type Likert jusqu’à quel point l’expression présentée correspondait à une des dix émotions cibles. Les résultats ont montré qu’il n’y avait pas de différence dans les scores de reconnaissance de l’émotion cible entre l’apparition simultanée et séquentielle des AUs pour les dix émotions. Ainsi, il n’y aurait pas de préférence pour une théorie vis-à-vis d’une autre selon le décours temporel d’une expression émotionnelle. Cependant, les seules séquences présentées aux participants étaient celles prédites par le MPC (Scherer, 1984, 1987) pour chacune des émotions cibles, ce qui ne permettait pas de comparer avec les autres possibilités d’ordres d’apparition. C’est pourquoi Krumhuber et Scherer (2016) ont comparé les mêmes hypothèses pour l’expression faciale de la peur, mais en utilisant toutes les permutations possibles d’AUs. Malgré cet ajout, comme pour Wehrle et collaborateurs (2000), aucune différence selon les scores de reconnaissance n’a été détectée entre les deux prédictions. De ce fait, les séquences n’étaient pas plus reconnues comme l’émotion cible que l’apparition simultanée des AUs, suggérant qu’elles ont la même valeur expressive. Toutefois, les AUs liées à l’expression prototypique de la peur qui étaient présentées selon un ordre postulé par le MPC (Scherer, 1984, 1987) étaient mieux perçues comme de la peur que celles qui étaient présentées selon les autres possibilités d’ordres d’apparition. Pour ce qui est des expressions d’émotions, ces résultats précédents suggèrent que certaines séquences d’AUs seraient perçues comme semblables à l’apparition synchronisée des AUs tandis que d’autres séquences d’AUs seraient plutôt perçues comme moins associées à l’émotion cible.