• Aucun résultat trouvé

8. Analyses acoustiques et perceptives du corpus recueilli

8.4. Evaluation perceptive du sous‐corpus sélectionné

8.4.4 Regroupement de catégories par classification hiérarchique

L’analyse  qualitative  des  données  recueillies  dans  les  matrices  de  confusion  pour  chacune  des  conditions  de  présentation  laisse  apparaître  d’importantes  confusions  mutuelles  entre  les  étiquettes  proposées  aux  sujets,  qui  constituent  une  source  d’information riche, comme le souligne Scherer (2003, p.236) : 

« […] les confusions que font les auditeurs peuvent être considérées comme encore plus  intéressantes [que la précision de décodage] car les erreurs ne sont pas distribuées au hasard et  les patterns de ces erreurs d’identification fournissent d’importantes informations sur le  processus de décodage. » 25 

Ainsi  Johnstone  &  Scherer  (2000)  indiquent  que  les  confusions  sont  plus  larges  à  l’intérieur d’une même famille d’émotion, en s’appuyant notamment sur l’exemple de la  colère chaude et de la colère froide, et proposent de mettre à profit ces confusions entre  émotions comme une mesure de proximité entre émotions ou classes d’émotions. Ces  conclusions prolongent les travaux de Banse & Scherer (1996), qui suggèrent que les  patterns de confusion entre émotions peuvent être largement expliqués selon les trois  dimensions de qualité de l’émotion, d’intensité et de valence. Néanmoins ils pointent  également du doigt la dissymétrie des patterns de confusions observés dans leur étude,  qui indique que ces trois dimensions ne permettent pas d’expliquer l’ensemble des  confusions. 

Afin  de  pouvoir  étudier  des  tendances  plus  générales,  notamment  dans  l’optique  d’expérimentations ultérieures sur des stimuli présentés en condition audio, nous avons  donc voulu prendre en compte les principales confusions entre étiquettes dans cette  condition en définissant des classes plus larges, ce qui n’exclut pas pour autant d’étudier  les patterns de confusion entre ces classes plus larges. Nous avons pour cela eu recours à  une classification hiérarchique fondée sur les distances entre colonnes de la matrice de  confusion  (c’est‐à‐dire  les  catégories  d’expressions  émotionnelles  telles  qu’elles sont  utilisées par les sujets pour donner leurs réponses) en condition audio seul, dont le 

       

25 Traduction personnelle de la citation originale “[…] the confusions listeners make are arguably even more  interesting  [than  decoding  accuracy]  as  errors  are  not  randomly  distributed  and  as  the  patterns  of  misidentification provide important information on the judgment process.” 

résultat est présenté Figure 30. Etant donné que nous considérons ici les colonnes de la  matrice de confusion, toutes ces colonnes n’ont pas un poids égal. Afin de prendre en  compte pour le calcul des distances dans la classification hiérarchique la forme de la  distribution et non ces variations de poids des colonnes, chaque colonne a été normalisée  par la somme de ses éléments. 

 

Figure 30 : Dendrogramme issu de la classification hiérarchique (critère d’agrégation de Ward) opérée  sur les colonnes normalisées de la matrice de confusion correspondant à l’évaluation de productions  actées sélectionnées du locuteur M2 en condition audio seul. 

A partir de ces confusions, nous proposons de définir les regroupements suivants pour  l’analyse des réponses données par les sujets en condition AS : 

 Les étiquettes anxiété, inquiétude et peur sont regroupées. Ces étiquettes renvoient à  des affects susceptibles d’apparaître en réaction à une menace directe ou indirecte. 

 Les étiquettes joie, satisfaction et amusement sont regroupées au sein d’une même  catégorie. Elles ont en commun une valence positive, qui les oppose à l’ensemble des  autres étiquettes représentées dans cet ensemble. 

 Les étiquettes déception, résignation et tristesse sont également regroupées. Le choix de  regrouper déception et résignation, qui sont les deux premières étiquettes regroupées  (cf. Figure 30), semble logique en dépit de la faiblesse des reports de résignation vers  déception. Toutefois le regroupement de ces deux étiquettes avec tristesse est moins  évident, sauf à considérer un regroupement global incluant également attente et  neutre : en effet ces cinq étiquettes sont regroupées dans l’analyse hiérarchique à un  niveau proche de celui correspondant au regroupement de joie et satisfaction. Plutôt  que  de  conserver  pour  les  analyses  ultérieures  une  telle  classe  comprenant  5  étiquettes qui renvoient à des manifestations affectives par trop variables, nous avons  choisi de la scinder en deux ensembles. En effet, un tel regroupement aurait conduit à  considérer cette classe comme une catégorie par défaut sans que des informations  pertinentes puissent être tirées du choix de l’un des membres de cette classe par les  sujets. Les étiquettes tristesse, déception et résignation correspondant à des réactions  passives du sujet face aux événements évalués comme négatifs pour lui, nous avons  jugé  préférable  d’opérer  un  regroupement  entre  ces  3  catégories.  Bien  que,  contrairement aux autres regroupements effectués, les liens entre tristesse, déception et  résignation soient moins directs, nous considérons que la qualité des expressions de la  tristesse  actée  est  à  mettre  en  cause  plutôt  que  la  proximité  cognitive  de  ces  étiquettes. L’acteur, peut‐être car il n’avait pas ressenti ou exprimé dans la partie  spontanée du  corpus de la tristesse  qui aurait  pu  servir de référence pour  son  expression actée, s’est efforcé de la produire avec une activation importante. Ceci  peut expliquer la faiblesse des confusions avec déception ou résignation. De plus, une  partie des expressions de tristesse produites par ce locuteur l’a été avec un niveau de  tremblement vocal (vocal tremor) élevé, d’où l’importance relative des reports de  tristesse vers amusement, cette caractéristique acoustique pouvant également évoquer  le rire. 

 Les étiquettes neutre et attente situées par le locuteur dans les passages du scénario,  où  il  ne  ressentait  pas  d’émotions  mais  était  concentré  sur  la  tâche,  ont  été  regroupées. En effet, ces deux expressions transmettent une valence nulle et une  activation faible. En ce sens, et bien qu’elles contribuent à l’expressivité du locuteur,  il est possible de s’interroger sur la mesure dans laquelle ces expressions d’attente  constituent ou non des expressions émotionnelles en tant que telle. En effet la plupart  des théories des émotions, qu’elles proposent une approche simplifiée centrée sur les  phénomènes de haut niveau dans une optique computationnelle comme le modèle  OCC  d’Ortony  et  al.  (2000),  ou  aussi  élaborées  que  le  modèle  des  processus  composants de Scherer (2001), considèrent l’évaluation de la valence d’un stimulus  comme central dans la réaction émotionnelle. 

 Enfin,  nous  avons  conservé  les  étiquettes  colère,  dégoût  et  surprise  comme  des  catégories séparées. Ce sont les dernières agrégées par la classification hiérarchique. 

De  plus,  elles  correspondent  à  des  expressions  d’émotions  dites  « basiques »,  auxquelles il est délicat de rattacher les affects moins prototypiques rejoués par  l’acteur d’après ceux ressentis durant l’induction, qui ne peuvent être considérés  comme relevant de la même famille d’émotions. 

Afin de comparer les principales confusions entre étiquettes en condition AS et AV, une  classification hiérarchique ascendante a également été effectuée sur les colonnes de la  matrice  de  confusion  en  condition  AV,  normalisées  par  la  somme  des  intensités  attribuées  à  chaque  colonne.  Le  dendrogramme  résultant  de  cette  classification  hiérarchique est présenté en Figure 31. De même qu’en condition AS, les confusions  mutuelles importantes nous permettent d’aboutir à un premier regroupement entre joie,  satisfaction et amusement, à un second entre anxiété, inquiétude et peur et un dernier entre  déception et résignation. Les étiquettes colère, surprise et dégoût demeurent quant à elles  bien séparées, et attente et neutre restent relativement proches. En revanche, la répartition  est très différente pour la tristesse, qui est dans cette condition bien séparée des autres  étiquettes. 

 

Figure 31 : Dendrogramme issu de la classification hiérarchique (critère d’agrégation de Ward) opérée  sur les colonnes normalisées de la matrice de confusion correspondant à l’évaluation de productions