• Aucun résultat trouvé

Évaluation du degré de gêne

9.2 Protocole expérimental d’évaluation en contexte multi-tâche

9.3.1 Évaluation du degré de gêne

Concernant le premier point d’intérêt, c’est-à dire le degré de gêne qu’ont ressenti les partici- pants, la figure 9.4 montre les évaluations moyennées sur le panel de participants et leur écart-type pour chacun des 5 sons. Sur cette figure, les valeurs sur l’axe des ordonnées représentent les étiquettes de l’échelle allant de ‘0’ pour « pas du tout » à ‘4’ pour « beaucoup ». On peut y observer de fortes va- riations parmi les participants.

Compte tenu des écarts-types important des évaluations, il semble alors impossible de faire appa- raître des différences significatives entre les évaluations moyennes de chaque son. L’écart-type moyen

etm vaut 0, 90, tandis que l’écart-type des évaluations moyennes met vaut 0, 29. Les coefficients de concordance de Kendall et de corrélation de rang de Spearman, qui traduisent le degré de concor- dance de l’ordonnancement des sons sur l’échelle des évaluations par les différent participants (voir sections 7.3, et C.1 en annexe, pour plus de détails) sont particulièrement faibles, et n’atteignent que,

FIGURE9.4 – Échelle moyenne et écarts-types des évaluations du degré de gêne pour l’ensemble du

panel de participants. Les 5 valeurs de ‘0’ à ‘4’ correspondent respectivement aux étiquettes des 5 niveaux de l’échelle : « pas du tout », « un peu », « assez », « nettement », et « beaucoup ».

respectivement, W = 0,10 et ¯rs= 0, 07. Ces éléments statistiques inter-participants sont résumés dans la première colonne du tableau 9.1 et confirment que les évaluations moyennes des 5 sons ne sont pas significativement différentes.

En conséquence, il est nécessaire de s’intéresser à la répartition des évaluations individuelles au- tour des valeurs moyennes. Dans cette optique, une analyse de cluster a été appliquée aux résultats individuels (voir section C.2 en annexe). La représentation hiérarchique résultant de cette analyse est affichée en figure 9.51.

À la lumière de ce dendrogramme, il semble qu’il y ait une importante divergence dans les ré- sultats de deux groupes de participants (mise en évidence par la ligne verticale rouge en pointillés), qui explique probablement en partie les forts écarts-types et la faible différenciation des évaluations moyennes des 5 sons. En effet, le nœud où se rejoignent les clusters correspondant à ces deux groupes se situe à une distance cophénétique aux alentours de 0, 65, ce qui correspond à un coefficient de cor- rélation de −0,3. Le groupe 1 est constitué de 18 participants, tandis que le groupe 2 est constitué de 9 participants. Il n’a pas été mis en évidence de lien apparent entre cette séparation et les « caracté- ristiques » des participants (âge, sexe, etc.).

Le groupe 2, plus petit des deux, étant ici d’une taille significative, il ne s’agit pas seulement d’en considérer les éléments comme des outliers, mais bien de le considérer comme une tendance alter- native réelle. En conséquence, plutôt que de retirer ces participants du panel, les 2 groupes ont été considérés séparément dans les analyses subséquentes. Il convient donc tout d’abord de représenter, comme en figure 9.4, les évaluations moyennes et leurs écarts-types pour les 2 groupes de partici- pants. Les figures 9.6 et 9.7 permettent d’observer ces éléments respectivement pour le groupe 1 et pour le groupe 2. Sur ces figures, les valeurs sur l’axe des ordonnées représentent les étiquettes de l’échelle allant de ‘0’ pour « pas du tout » à ‘4’ pour « beaucoup ». Les valeurs des éléments statis- tiques inter-participants sont légèrement améliorés pour les deux groupes, et valent respectivement

1. Sur ce dendrogramme, seuls 27 des 29 participants sont représentés, car les résultats de 2 des participants se sont avérés incohérents avec les instructions données

FIGURE9.5 – Dendrogramme correspondant aux corrélations inter-participant des évaluations du

degré de gêne

etm1= 0, 76, met1= 0, 53, W1= 0, 36 et ¯rs1= 0, 33, et etm2= 0, 86, met2= 0, 62, W2= 0, 40 et ¯rs2= 0, 33. Ils

sont résumés dans les deuxième et troisième colonnes du tableau 9.1. Bien qu’ils ne soient que peu satisfaisants, on peut tout de même distinguer, à la vue des formes respectives des deux courbes sur les figures 9.6 et 9.7, que l’ordonnancement des sons sur l’échelle des évaluations moyennes diffère entre les deux groupes.

Panel Groupe 1 Groupe 2

etm 0,90 0,76 0,86

met 0,29 0,53 0,62

W 0,10 0,36 0,40

¯

rs 0,07 0,33 0,33

TABLE9.1 – Éléments statistiques inter-participants des évaluations du degré de gêne pour, respecti- vement, l’ensemble du panel de participants, le groupe 1 et le groupe 2 (écart-type moyen entre les participants etm, écart-type entre les évaluations moyennes des sons met, coefficient de concordance de Kendall W et coefficient de corrélation de rang de Spearman ¯rs).

Les résultats affichés sur les figures 9.6 et 9.7 doivent être considérés vis-à-vis d’une évaluation comparable des sons dans un contexte classique où les sons sont jugés sans tâche subsidiaire, c’est- à-dire en contexte d’écoute « attentive ». La figure 9.8 reprend les résultats exposés en section 7.5, cor- respondant à une expérience réalisée en condition d’écoute attentive. L’échelle a été spécialement adaptée afin de permettre la comparaison avec les résultats présentés ici. En effet, lors de cette expé- rience, l’échelle mesurée représentait la qualité sonore allant de ‘0’ pour le « plus désagréable » à ‘10’ pour le « plus agréable ». Compte tenu de l’échelle utilisée ici, la transformation linéaire de l’échelle

p1alors obtenue en une échelle comparable ici p2consiste en l’opération suivante :

p2= ³ 1 −p1 10 ´ · 4 (9.1)

FIGURE 9.6 – Échelle moyenne et écarts-types des évaluations du degré de gêne pour le pre- mier groupe de participants. Les 5 valeurs de ‘0’ à ‘4’ correspondent respectivement aux éti- quettes des 5 niveaux de l’échelle : « pas du tout », « un peu », « assez », « nettement », et « beaucoup ».

FIGURE 9.7 – Échelle moyenne et écarts-types des évaluations du degré de gêne pour le second groupe de participants. Les 5 valeurs de ‘0’ à ‘4’ correspondent respectivement aux étiquettes des 5 niveaux de l’échelle : « pas du tout », « un peu », « assez », « nettement », et « beaucoup ».

FIGURE9.8 – Échelle moyenne et écarts-types des évaluations du ca-

ractère agréable/désagréable obtenus dans un contexte expérimental monotâche. L’échelle de ‘0’ à ‘4’ correspondent à l’échelle de qualité sonore mesurée au cours de l’expérience décrite en section 7.5, ayant été inversée (de ‘10’ à ‘0’) à l’aide de la formule 9.1.

L’observation des résultats de l’expérience en contexte d’écoute attentive permet de également de préciser les tendances aperçues sur les figures 9.6 et 9.7. Il semble que les résultats des participants du groupe 1 rejoignent ceux obtenus en condition d’écoute attentive en ce sens que l’ordonnancement des sons sur l’échelle est similaire (bien que plus différencié pour la condition d’écoute attentive). À l’inverse, les résultats du groupe 2 montrent une divergence relativement forte avec ceux de la condi- tion d’écoute attentive. Notamment, le son GNB3 v2 dif, qui émerge clairement des autres comme un son particulièrement désagréable en condition d’écoute attentive, s’avère bien moins dérangeant en contexte multi-tâche pour ce groupe de participants, et n’apparaît pas comme celui du corpus qui les a le plus perturbés. Le phénomène inverse se produit pour le son CST1 v3 rep.

Si tous les participants avaient manifesté la même tendance que les ceux du groupe 1, on pourrait conclure que le contexte attentionnel dans la procédure expérimentale pour la mesure de la gêne n’a pas d’influence sur les résultats. Mais en l’occurrence, l’identification d’un groupe minoritaire de participants montrant une certaine divergence avec la majorité, phénomène qui n’existait pas dans la condition de référence d’écoute attentive, empêche une telle conclusion. Il semble au contraire que le contexte attentionnel ait une influence significative sur les jugements de certains auditeurs, au moins dans le cas des sons de STA.

Par ailleurs, nous pourrions être tentés de comparer dans l’absolu les évaluations obtenues en condition d’écoute attentive et celles obtenues au cours de cette expérience, en condition d’écoute distraite. On remarque effectivement que, pour les deux groupes, à l’exception du son GNB3 v2 dif, les évaluations des quatre autres sons sont globalement plus élevées que les évaluations (telles que transformées par la formule 9.1) obtenues en condition d’écoute attentive. On pourrait ainsi conclure que la condition d’écoute attentive sous-estime la gêne réellement ressentie par les auditeurs. Tou- tefois, la nature des échelles d’évaluation proposées aux participants dans les deux expériences sont très différentes. Si, dans le cas de l’écoute attentive, l’échelle était relative et la consigne donnée aux participants leur demandait explicitement d’utiliser l’ensemble des valeurs possibles, l’échelle utili- sée ici peut être considérée comme absolue (de « pas du tout » à « beaucoup »), et la consigne donnée aux participants ne leur imposait pas d’utiliser l’ensemble de la gamme de valeurs. Par conséquent, il est impossible de comparer d’un point de vue global et absolu les évaluations dans les deux condi- tions.