• Aucun résultat trouvé

Le coefficient de corrélation de Bravais-Pearson nous donne un moyen d’établir un lien statis- tique entre deux variables. Toutefois, son interprétation reste quelque peu abstraite. La régression li-

néaire est un outil statistique dont l’interprétation graphique permet de se faire une meilleure idée de

ce que représente ce coefficient de corrélation. Tout d’abord, il convient de tracer ce que l’on nomme le diagramme de dispersion, qui consiste à représenter dans un repère cartésien les points dont les coordonnées correspondent aux valeurs des variables X et Y . La figure B.1 en montre un exemple. Sur ce graphique, on peut également tracer la droite de régression (en rouge sur la figure B.1). Elle est établie en tentant de minimiser les distances la séparant des points du diagramme. On cherche donc à modéliser l’éventuelle relation liant X et Y par une fonction affine, c’est-à-dire à estimer les valeurs de Y par la relation :Y = aX + b. Il s’agit donc de minimiser l’erreur de prédiction qui est la sommeb quadratique des écarts entre Y et son estimationY :b P(Y − Y )b 2.

FIGUREB.1 – Exemple de diagramme de dispersion et de droite de régression (provenant de la sec-

tion 7.6.1).

L’observation de la répartition du nuage de points autour de la droite de régression permet de mieux apprécier la qualité de la prédiction. Lorsque la prédiction est efficace, on doit constater que le nuage de points forme grossièrement une ellipse autour de la droite de régression. Cela va de paire avec un coefficient de corrélation r élevé en valeur absolue. Dans l’exemple de la figure B.1, r vaut -0,98, ce qui correspond à une forte corrélation, confirmée par la répartition des points autour de la droite de régression.

Méthodes d’analyse de variabilité des

réponses

La particularité des expériences perceptives est de faire appel à des participants volontaires, qui ont, à priori, leur sensibilité propre vis-à-vis des sons étudiés. Il s’en traduit des jugements – dont la forme dépend du type d’expérience – reflétant parfois un caractère très subjectif. La conséquence possible lors d’une expérience perceptive est une forte variabilité des réponses recueillies. Cette va- riabilité peut s’avérer très problématique lorsque le but de l’expérience est d’extraire des données – sous quelque forme que ce soit – moyennées sur le panel de participant. En effet, le cas échéant, la significativité statistique des différences observées sur les données moyennes peut alors être dif- ficile à démontrer, empêchant ainsi de faire émerger de manière concluante certaines tendances. Il convient alors de comparer les résultats des participants entre eux et de vérifier la concordance de leurs résultats.

Cette annexe présente deux méthodes permettant d’analyser et de comparer entre eux les résul- tats individuels des participants d’une expérience. La section C.1 expose l’évaluation de deux coef- ficients – toutefois liés l’un à l’autre – permettant d’obtenir une mesure globale de la variabilité des réponses des participants : le coefficient de concordance de Kendall et le coefficient de corrélation de rang de Spearman. La section C.2 présente la méthode d’analyse de cluster appliquée aux résul- tats d’un panel de participant afin d’observer la dispersion des réponses des participants autour de la tendance moyenne.

C.1 Concordance de Kendall et corrélation de rang de Spearman

Afin de comparer les résultats d’un ensemble de participants dans le cadre d’une expérience per- ceptive, il convient de comparer l’ordonnancement des échelles mesurées pour chaque participant et de tenter de quantifier le degré de concordance entre les ordonnancements obtenus. Ceci peut se faire au moyen du coefficient de concordance de Kendall et du coefficient de corrélation de rang de Spearman (voir [78] pour plus de détails).

C.1.1 Coefficient de concordance de Kendall

Pour calculer le coefficient de concordance de Kendall, il convient en premier lieu de sommer les classements successifs de chaque son. Par exemple, si un son a été classé successivement 1er, 2eet 5e,

la somme des classements vaut 8. Le coefficient se calcule alors comme le quotient de la variance des sommes ainsi calculées sur la variance maximale possible de ces sommes pour ce nombre de sons et

pour ce nombre de participants. Comme nous travaillons ici avec des rangs (de 1 à N pour N sons), nous connaissons la variance maximale possible des sommes de classement. Il est ainsi possible de définir la formule du coefficient de concordance de Kendall par :

W = 12P jTj2 k2N (N2− 1)− 3(N + 1) N − 1 (C.1)

avec Tjla somme des classements du son j ,

N le nombre de sons, et k le nombre de participants.

C.1.2 Coefficient de corrélation de rang de Spearman

Le coefficient de concordance de Kendall n’est pas un coefficient de corrélation à proprement parler, et son interprétation n’est pas triviale. En revanche, il est possible de le relier au coefficient de corrélation de rang de Spearman rs(voir [78]). Ce dernier est adéquat lorsque l’on souhaite évaluer la concordance entre les classements effectués par deux participants seulement. Il est alors possible de calculer ce coefficient pour chaque paire de participants parmi les k participants considérés pour en évaluer la moyenne ¯rs, mais ceci peut s’avérer assez fastidieux. Toutefois, il existe une formule reliant

¯

rsau coefficient de concordance de Kendall :

¯

rs=kW − 1

k − 1 (C.2)

avec k le nombre de participants.

Il est alors possible de tester la significativité statistique du coefficient obtenu comme pour le coefficient de corrélation de Bravais-Pearson (voir annexe B), afin de conclure sur la concordance globale entre les réponses des participants. Il est à noter que cette technique peut être appliquée à chacune des méthodes exposées en section 2.3.1, si tant est que l’on ait transformé les données obtenues en données de classement.