SN4 Statistique Emmanuel Duran p1
Statistique
Les distributions à deux caractères
1) Définition
Lorsqu’on étudie simultanément deux caractères, on obtient deux valeurs pour chaque unité statistique d’une population ou d’un échantillon. Ces valeurs peuvent s’exprimer sous la forme d’un couple (X,Y). L’ensemble des couples (X,Y) constitue une distribution à deux caractères, ou distribution à deux variables.
Exemple : On considère la note en maths et en français de 12 élèves d’une classe à la fin de la première étape de sec 4.
Élève Note en Maths %
Note en français
%
Élève Note en Maths %
Note en
français % Élève Note en Maths %
Note en français
%
1 32 48 5 65 63 9 65 66
2 50 61 6 92 95 10 72 60
3 70 74 7 75 80 11 55 83
4 88 76 8 38 52 12 77 80
2) Représentation d’une distribution à deux caractères 2.1 Nuage de points
SN4 Statistique Emmanuel Duran p2 2.2 Nuage de points avec calculatrice
Insérer une page « Tableur & Listes » Nommer les colonnes
Insérer une page « Données et Statistiques » Cliquer sur l’axe des abscisses pour ajouter la variable « maths »
Cliquer sur l’axe des ordonnées pour ajouter la variable « français »
SN4 Statistique Emmanuel Duran p3 Valeur en y
2.3 Tableau à double entrée
3) La corrélation linéaire
3.1 Appréciation qualitative d’une corrélation
• Parfaite
• Forte
• Moyenne
• Faible
• Nulle
3.2 Sens de la corrélation
Note en Note français en maths %
%
[45,60[ [60,75[ [75,90[ [90,105[
[30,45[ II
[45,60[ I I
[60,75[ IIII
[75,90[ III
[90,105[ I
Valeur en x
positive négative
SN4 Statistique Emmanuel Duran p4 4) Le coefficient de corrélation linéaire
Il se note r.
Sa valeur est comprise entre
[ ]
−1,1Intensité de la corrélation en fonction de la valeur de r
4.1 Comment trouver le coefficient de corrélation linéaire 4.1.1 Estimation avec la méthode du rectangle
Après avoir tracé votre nuage de points, encadrer tous les points dans le plus petit rectangle possible et mesurer sa longueur et sa largeur.
L’utilisation d’une règle et d’une équerre est recommandée!
Parfaite Forte
Moyenne
Faible
Nulle
Faible
Moyenne Forte
Parfaite
SN4 Statistique Emmanuel Duran p5
largeur 1 longueur
r
= ± −
4.1.2 Estimation du coefficient de corrélation avec la calculatrice
Se placer dans une case vide de la colonne C Cliquer sur Menu 4 (statistiques),1 (Calcul statistique), 3 (Ajustement linéaire mx+b)
Sélectionner les variables On obtient le coefficient « r » de la corrélation
C’est à toi de choisir le signe en fonction du sens de la corrélation
SN4 Statistique Emmanuel Duran p6
Y1 Y2
X2
X1
5 La droite de régression linéaire
5.1 La méthode des points moyens ou la double moyenne ou la méthode de Mayer
Pour estimer la droite de régression à l’aide de la méthode de Mayer, il suffit de suivre les étapes suivantes :
• Placer les coordonnées en ordre croissant des abscisses. (Pour deux valeurs de X égales, ordonner les valeurs de Y en ordre croissant).
• Partager la distribution en deux groupes équipotents. (Si le nombre de données est impair, la donnée du centre est placée dans chacun des deux groupes).
• Pour chacun des deux groupes, trouver la moyenne des abscisses et la moyenne des ordonnées que l’on notera P (x ,y ) et P (x ,y ) . 1 1 1 2 2 2
• Trouver l’équation de la droite de régression passant par ces deux points.
Exemple #1
x 6 3 14 14 27 22 19 9
y 5 2 6 10 17 21 14 7
x 3 6 9 14 14 19 22 27
y 2 5 7 6 10 14 21 17
1 2
1 2 1 2
3+6+9+14 14+19+22+27
x = =8 x = =20,5
4 4
2+5+7+6 10+14+21+17
y = =5 y = =15,5 P (8,5) etP (20,5 , 1 )
4 4 ⇔ 5,5
Pour tracer la droite de Mayer dans le nuage de points, on place P1 et P2 dans le graphique et on trace la droite passant par ces deux points.
SN4 Statistique Emmanuel Duran p7 L’équation de la droite de régression, passant par P1 et P2 est de la forme y=ax+b
Exemple #2 Si les données sont impaires!
On double la donnée du centre après les avoir classées
x 0 2 4 6 8 12 14
y 1 3 5 7 9 13 16
x 0 2 4 6 6 8 12 14
y 1 3 5 7 7 9 13 16
Par la suite le processus est le même que dans l’exemple #1
5.2 Avec la calculatrice
Les étapes sont les mêmes que dans la section 4.1.2 cependant l’équation est donnée sous la forme y=mx+b
À noter que dans la calculatrice il n’est pas nécessaire d’ordonner les valeurs ou de doubler une valeur si le nombre est impair.
2 1
2 1
1 2
15,5 5 20,5 8 0,84 0,84
En remplaçant les coordonnées de P ou P on trouve:
15,5=0,84 20,5+b 15,5=17,22+b 15,5-17,22=b b=-1,72
L'équation de la droite de Mayer esty=0,84x-1,72 y y
a y
x x x
y x b
∆ − −
= = = =
∆ − −
⇔ = +
×
SN4 Statistique Emmanuel Duran p8 On peut aussi tracer la droite et obtenir son équation dans une page « Données &
Statistiques »
Après avoir tracé le nuage de points faire Menu 4 (Analyser) 6 (Régression) 1 (Afficher droite mx+b)