8. Analyses acoustiques et perceptives du corpus recueilli
8.4. Evaluation perceptive du sous‐corpus sélectionné
8.4.4 Regroupement de catégories par classification hiérarchique
L’analyse qualitative des données recueillies dans les matrices de confusion pour chacune des conditions de présentation laisse apparaître d’importantes confusions mutuelles entre les étiquettes proposées aux sujets, qui constituent une source d’information riche, comme le souligne Scherer (2003, p.236) :
« […] les confusions que font les auditeurs peuvent être considérées comme encore plus intéressantes [que la précision de décodage] car les erreurs ne sont pas distribuées au hasard et les patterns de ces erreurs d’identification fournissent d’importantes informations sur le processus de décodage. » 25
Ainsi Johnstone & Scherer (2000) indiquent que les confusions sont plus larges à l’intérieur d’une même famille d’émotion, en s’appuyant notamment sur l’exemple de la colère chaude et de la colère froide, et proposent de mettre à profit ces confusions entre émotions comme une mesure de proximité entre émotions ou classes d’émotions. Ces conclusions prolongent les travaux de Banse & Scherer (1996), qui suggèrent que les patterns de confusion entre émotions peuvent être largement expliqués selon les trois dimensions de qualité de l’émotion, d’intensité et de valence. Néanmoins ils pointent également du doigt la dissymétrie des patterns de confusions observés dans leur étude, qui indique que ces trois dimensions ne permettent pas d’expliquer l’ensemble des confusions.
Afin de pouvoir étudier des tendances plus générales, notamment dans l’optique d’expérimentations ultérieures sur des stimuli présentés en condition audio, nous avons donc voulu prendre en compte les principales confusions entre étiquettes dans cette condition en définissant des classes plus larges, ce qui n’exclut pas pour autant d’étudier les patterns de confusion entre ces classes plus larges. Nous avons pour cela eu recours à une classification hiérarchique fondée sur les distances entre colonnes de la matrice de confusion (c’est‐à‐dire les catégories d’expressions émotionnelles telles qu’elles sont utilisées par les sujets pour donner leurs réponses) en condition audio seul, dont le
25 Traduction personnelle de la citation originale “[…] the confusions listeners make are arguably even more interesting [than decoding accuracy] as errors are not randomly distributed and as the patterns of misidentification provide important information on the judgment process.”
résultat est présenté Figure 30. Etant donné que nous considérons ici les colonnes de la matrice de confusion, toutes ces colonnes n’ont pas un poids égal. Afin de prendre en compte pour le calcul des distances dans la classification hiérarchique la forme de la distribution et non ces variations de poids des colonnes, chaque colonne a été normalisée par la somme de ses éléments.
Figure 30 : Dendrogramme issu de la classification hiérarchique (critère d’agrégation de Ward) opérée sur les colonnes normalisées de la matrice de confusion correspondant à l’évaluation de productions actées sélectionnées du locuteur M2 en condition audio seul.
A partir de ces confusions, nous proposons de définir les regroupements suivants pour l’analyse des réponses données par les sujets en condition AS :
Les étiquettes anxiété, inquiétude et peur sont regroupées. Ces étiquettes renvoient à des affects susceptibles d’apparaître en réaction à une menace directe ou indirecte.
Les étiquettes joie, satisfaction et amusement sont regroupées au sein d’une même catégorie. Elles ont en commun une valence positive, qui les oppose à l’ensemble des autres étiquettes représentées dans cet ensemble.
Les étiquettes déception, résignation et tristesse sont également regroupées. Le choix de regrouper déception et résignation, qui sont les deux premières étiquettes regroupées (cf. Figure 30), semble logique en dépit de la faiblesse des reports de résignation vers déception. Toutefois le regroupement de ces deux étiquettes avec tristesse est moins évident, sauf à considérer un regroupement global incluant également attente et neutre : en effet ces cinq étiquettes sont regroupées dans l’analyse hiérarchique à un niveau proche de celui correspondant au regroupement de joie et satisfaction. Plutôt que de conserver pour les analyses ultérieures une telle classe comprenant 5 étiquettes qui renvoient à des manifestations affectives par trop variables, nous avons choisi de la scinder en deux ensembles. En effet, un tel regroupement aurait conduit à considérer cette classe comme une catégorie par défaut sans que des informations pertinentes puissent être tirées du choix de l’un des membres de cette classe par les sujets. Les étiquettes tristesse, déception et résignation correspondant à des réactions passives du sujet face aux événements évalués comme négatifs pour lui, nous avons jugé préférable d’opérer un regroupement entre ces 3 catégories. Bien que, contrairement aux autres regroupements effectués, les liens entre tristesse, déception et résignation soient moins directs, nous considérons que la qualité des expressions de la tristesse actée est à mettre en cause plutôt que la proximité cognitive de ces étiquettes. L’acteur, peut‐être car il n’avait pas ressenti ou exprimé dans la partie spontanée du corpus de la tristesse qui aurait pu servir de référence pour son expression actée, s’est efforcé de la produire avec une activation importante. Ceci peut expliquer la faiblesse des confusions avec déception ou résignation. De plus, une partie des expressions de tristesse produites par ce locuteur l’a été avec un niveau de tremblement vocal (vocal tremor) élevé, d’où l’importance relative des reports de tristesse vers amusement, cette caractéristique acoustique pouvant également évoquer le rire.
Les étiquettes neutre et attente situées par le locuteur dans les passages du scénario, où il ne ressentait pas d’émotions mais était concentré sur la tâche, ont été regroupées. En effet, ces deux expressions transmettent une valence nulle et une activation faible. En ce sens, et bien qu’elles contribuent à l’expressivité du locuteur, il est possible de s’interroger sur la mesure dans laquelle ces expressions d’attente constituent ou non des expressions émotionnelles en tant que telle. En effet la plupart des théories des émotions, qu’elles proposent une approche simplifiée centrée sur les phénomènes de haut niveau dans une optique computationnelle comme le modèle OCC d’Ortony et al. (2000), ou aussi élaborées que le modèle des processus composants de Scherer (2001), considèrent l’évaluation de la valence d’un stimulus comme central dans la réaction émotionnelle.
Enfin, nous avons conservé les étiquettes colère, dégoût et surprise comme des catégories séparées. Ce sont les dernières agrégées par la classification hiérarchique.
De plus, elles correspondent à des expressions d’émotions dites « basiques », auxquelles il est délicat de rattacher les affects moins prototypiques rejoués par l’acteur d’après ceux ressentis durant l’induction, qui ne peuvent être considérés comme relevant de la même famille d’émotions.
Afin de comparer les principales confusions entre étiquettes en condition AS et AV, une classification hiérarchique ascendante a également été effectuée sur les colonnes de la matrice de confusion en condition AV, normalisées par la somme des intensités attribuées à chaque colonne. Le dendrogramme résultant de cette classification hiérarchique est présenté en Figure 31. De même qu’en condition AS, les confusions mutuelles importantes nous permettent d’aboutir à un premier regroupement entre joie, satisfaction et amusement, à un second entre anxiété, inquiétude et peur et un dernier entre déception et résignation. Les étiquettes colère, surprise et dégoût demeurent quant à elles bien séparées, et attente et neutre restent relativement proches. En revanche, la répartition est très différente pour la tristesse, qui est dans cette condition bien séparée des autres étiquettes.
Figure 31 : Dendrogramme issu de la classification hiérarchique (critère d’agrégation de Ward) opérée sur les colonnes normalisées de la matrice de confusion correspondant à l’évaluation de productions