CORRIGE TD8 corrélation Exercice 1
Le fichier de données ci-après (lien) correspond à la taille (en pouces) et au poids (en livres) de 57 étudiants américains. On s’intéresse aux relations entre ces deux mesures.
TD 7correlation ex 1.SAV Sous SPSS :
1- représentez graphiquement les données
2- calculez le coefficient de corrélation pour ces données 3- ce coefficient est-il significativement différent de 0 ? Refaites l’exercice sous Excel.
Pour la question 3 : Formulez vos hypothèses
Utilisez un test t avec la formule suivante t = [r * racine (N-2)] / racine(1-r²)
distribué comme t à N-2 degrés de liberté Sous SPSS
1- diagramme de
dispersion simple sous SPSS dans le menu « graphes »
POIDS
220 200
180 160
140 120
TAILLE
76
74
72
70
68
66
64
Corrélations
1 .604**
. .000
373.561 1627.184 6.671 29.057
57 57
.604** 1
.000 .
1627.184 19449.053 29.057 347.305
57 57
Corrélation de Pearson Sig. (bilatérale) Somme des carrés et produits croisés Covariance N
Corrélation de Pearson Sig. (bilatérale) Somme des carrés et produits croisés Covariance N
TAILLE
POIDS
TAILLE POIDS
La corrélation est significative au niveau 0.01 (bilatéral).
**.
2- menu analyse/corrélation/bivariée corrélation de pearson r = 0.604
3- SPSS donne directement la réponse : r significativement différent de 0 au seuil 0.01
4- copier-coller les données dans Excel, utiliser la fonction
« insertion/graphique/nuage de points » - suivant – « plage de données/séries en colonnes » et sélectionner les deux colonnes.
5- Choisir une case. Insertion/fonction, choisir « coefficient de corrélation » dans les fonctions statistiques.
6- H0 : le coefficient de corrélation = 0. H1 : le coefficient de corrélation est différent de 0.
7- Choisir une autre case. Faire = puis utiliser la formule du t. calculer t.
Sélectionner une autre case. Insertion/fonction, choisir « loi de student » dans les fonctions statistiques, donner la case où se trouve t, N-2 (55) degrés de liberté, test bilatéral.
Exercice 2 :
Ici on ne connaît rien sur la distribution. En ce qui concerne le temps de boisson, on voit qu’il y a une diminution avec l’âge mais celle-ci n’est pas forcément linéaire. C’est donc un r de Spearman qu’il faut calculer ici.
0 5 10 15 20 25 30 35 40
0,5 1 1,5 2 2,5 3 Years
MALES FEMALES
Le r de Spearman dit seulement si ça va dans le même sens (ou en sens contraire), contrairement au r de Pearson qui indique une relation linéaire.
Non paramétrique, n’exige aucune hypothèse sur la loi de probabilité de x ou de y
Entre 1 et 3 ans, les évitements provoqués augmentent avec l’âge pour les femelles Et diminuent avec l’âge pour les mâles.
r de Spearman : r = 0.94, p = 0.0167 pour les femelles r=-0.88, p = 0.0333 pour les mâles.
Les agressions émises par les mâles diminuent avec l’âge : spearmann r = -0.85, two tailed p=
0.006
0 10 20 30 40 50 60
1 2 3 4 5 6 7 8 9 Years
Le temps de boisson des mâles diminue avec l’âge (spearman r = -0.88, p = 0.003).