Paramètres de position et de dispersion
I) Mesures de position 1) La moyenne
a) Définition
Soit la série statistique définie dans le tableau suivant :
Valeur x1 x2 ... xp
Effectif n1 n2 ... np
Effectif total : N = 𝒏𝟏+ 𝒏𝟐+ ⋯ + 𝒏𝒑
La moyenne de cette série statistique est le réel, noté ⎯x, tel que :
𝒙 =
𝒏
𝟏𝒙
𝟏+ 𝒏
𝟐𝒙
𝟐+⋯+ 𝒏
𝒑𝒙
𝒑𝑵
Exemple 1:
Soit la série statistique répertoriant la taille en mètres de 100 requins blancs Taille
(en m ) 1,5 2 2,5 3 3,5 4 4,5
Effectif 8 10 25 32 19 4 2
La taille moyenne est :
𝑥 = 1,5x8 + 2x10 + 2,5x25 + 3x32 + 3,5x 19 + 4x4 + 4,5x2100 = 2,82 Exemple 2 :
Un supermarché a relevé les dépenses (en € ) de ses clients en 2 heures un jour donné, les résultats sont rassemblés dans le tableau suivant :
Dépenses
(en €) [ 0 ; 30 [ [ 30 ; 60 [ [ 60 ; 100 [ [ 100 ; 120 [ Milieu de
classe 15 45 80 110
Effectif 12 25 42 67
Pour calculer la moyenne on détermine les milieux des classes de la distribution puis on effectue le calcul : 𝑥 = 15x12 + 45x25 + 80x42 + 110x67 146 82,43 €
(146 est l’effectif total)
b) Propriété 1
On peut calculer la moyenne 𝑥 à partir de la distribution des fréquences :
Valeur 𝑥1 𝑥2 ... 𝑥𝑝
Fréquence f1 f2 ... fp
𝑥 = f1 𝑥1+ f2 𝑥2+ … + fp 𝑥𝑝 Exemple :
On étudie dans une maternité la taille de 50 nouveaux nés
Taille en cm 47 48 49 50 51 52
Effectif 5 8 12 15 9 1
Fréquence 0,1 0,16 0,24 0,3 0,18 0,02
𝑥 = 0,1x47 + 0,16x48 + 0,24x49 + 0,3x50 + 0,18x51 + 0,02x52 = 49,36
c) Propriété 2
Si on ajoute le même nombre k à toutes les valeurs de la série statistique, la moyenne augmente de k
Exemple :
Dans l’exemple précédent on pourrait soustraire 50 à toutes les tailles on obtiendrait une nouvelle moyenne :
𝑦 = 0,1x(-3) + 0,16x(-2) + 0,24x(-1) + 0,3x0 + 0,18x1 + 0,02x2 = – 0,64 et on retrouve 𝑥 en rajoutant 50 à 𝑦 : 𝑥 = – 0,64 + 50 = 49,36
d) Propriété 3
Si on multiplie toutes les valeurs de la série statistique par un même nombre k, la moyenne est multipliée par k
Exemple :
En étudiant maintenant la masse de 50 nouveaux nés de la maternité on obtient :
Masse en kg 2,8 2,9 3 3,1 3,2
Effectif 14 10 18 7 1
On peut multiplier les masses par 10 on calcule ainsi une moyenne 𝑦 : 𝑦 = 28x14+29x10+30x18+31x7+32x150 = 29,42
et on retrouve la moyenne en divisant 𝑦 par 10 : 𝑥 = 29,4210 = 2,942
2) La médiane
a) Définition
La liste des N données est rangée par ordre croissant.
• Si N est impair (N = 2n + 1) la médiane est la donnée de rang n + 1
• Si N est pair (N = 2n ) la médiane est la demi somme des données de rang n et de rang n + 1.
Exemple 1 :
Un boulanger teste les masses (en grammes) de 30 baguettes qu’il vient de fabriquer, il obtient les résultats suivants :
235 235 237 238 238 239 239 239 240 241
241 243 245 247 247 249 250 205 250 250
250 251 251 253 253 255 255 255 257 260
Comme l’effectif total N = 30 est pair la médiane est la demi-somme de la donnée de rang 15 et la donnée de rang 16 soit : 247 + 249 2 = 248
Me = 248 g
Exemple 2 :
Le tableau ci-dessous indique la durée (en minutes) de connexion internet par jour de 43 familles interrogées
Durée en
minutes 40 60 80 120 180 200 240 300
Effectif 2 9 11 7 5 2 4 3
Comme l’effectif total N = 43 = 2 x 21 + 1 est impair la médiane est la donnée de rang 22 soit 80 minutes
b) Propriétés
• Si on ajoute le même nombre k à toutes les valeurs de la série statistique, la médiane augmente de k
• Si on multiplie toutes les valeurs de la série statistique par un même nombre k, la médiane est multipliée par k
3) Les quartiles
a) Définitions
La liste des N données est rangée par ordre croissant :
● Le premier quartile (Q1) est la plus petite donnée de la liste telle qu’au moins un quart des données de la liste sont inférieures ou égales à Q1.
●Le troisième quartile (Q3) est la plus petite donnée de la liste telle qu’au moins les trois quarts des données de la liste sont inférieures ou égales à Q3
Méthode
a) L’effectif total N est un multiple de 4 :
● On ordonne la série dans l’ordre croissant
● On divise N par 4
● 𝑄1 est donc la valeur de rang 𝑁 4
● 𝑄3 est donc la valeur de rang 3𝑁 4
Exemple 1 : On considère la série :
11 ; 16 ; 7 ; 12 ; 19 ; 12 ; 18 ; 17 ; 13 ; 13 ; 14 ; 14 ; 15 ; 13 ; 16 ; 19
● On range la série dans l’ordre croissant :
7 ; 11 ; 12 ; 12 ; 13 ; 13 ; 13 ; 14 ; 14 ; 15 ; 16 ; 16 ; 17 ; 18 ; 19 ; 19
4ème valeur 12ème valeur
● N = 16 (il y a 16 valeurs) et 𝑁
4 = 16÷4 = 4
● 𝑄1 est donc la valeur de rang 4 c’est à dire la 4ème valeur 𝑄1= 12
● 𝑄3 est donc la valeur de rang 3𝑁
4 = 3×16÷4 = 12
𝑄3 est donc la valeur de rang 12 c’est à dire la 12ème valeur qui est 16 𝑄3= 16
b) L’effectif total N n’est pas un multiple de 4 :
● On ordonne la série dans l’ordre croissant
● On divise N par 4
● Le rang de 𝑄1 est le premier entier supérieur à 𝑁 4
● Le rang de 𝑄3 est le premier entier supérieur à rang 3𝑁 4
Exemple 1 : Reprenons l’exemple portant sur les masses des baguettes :
235 235 237 238 238 239 239 239 240 241
241 243 245 247 247 249 250 205 250 250
250 251 251 253 253 255 255 255 257 260
● N = 30
● 𝑁
4 = 304 = 7,5 Q1 est la donnée de rang 8, c’est-à-dire la 8ème donnée donc Q1 = 239 g et
● 3𝑁
4 =3 × 30
4 =22,5 Q3 est la donnée de rang 23 , c’est-à-dire la 23ème valeur Q3 = 251 g
Exemple 2 : Le tableau ci-dessous indique la durée (en minutes) de connexion internet par jour de 43 familles interrogées
Durée en
minutes 40 60 80 120 180 200 240 300
Effectif 2 9 11 7 5 2 4 3
Effectif
cumulé 2 11 22 29 34 36 40 43
L’effectif total N = 43
● 𝑁
4 = 434 = 10,75 Q1 est la donnée de rang 11, c’est-à-dire la 11ème valeur soit Q1 = 60 min et
● 3𝑁
4 =3 × 43
4 =32,25 Q3 est la donnée de rang 33, c’est-à-dire la 33ème valeur soit soit Q3 = 180 min
b) Illustration
II Mesures de dispersion 1) L’étendue
L’étendue d’une série statistique est égale à la différence entre la plus grande et la plus petite des données de la série.
Exemple 1 : Reprenons l’exemple portant sur les masses des baguettes :
235 235 237 238 238 239 239 239 240 241
241 243 245 247 247 249 250 205 250 250
250 251 251 253 253 255 255 255 257 260
L ‘étendue e = 260 – 235 = 25
Exemple 2 : Le tableau ci-dessous indique la durée (en minutes) de connexion internet par jour de 43 familles interrogées
Durée en minutes
40 60 80 120 180 200 240 300
Effectif 2 9 11 7 5 2 4 3
Effectif
cumulé 2 11 22 29 34 36 40 43
L’étendue e = 300 – 40 = 260
2) l’écart interquartile
L’écart interquartile est égal à la différence Q3 – Q1
Exemple 1 : Reprenons l’exemple portant sur les masses des baguettes :
235 235 237 238 238 239 239 239 240 241
241 243 245 247 247 249 250 205 250 250
250 251 251 253 253 255 255 255 257 260
Nous avons vu dans le paragraphe précédent que Q1 = 239 et Q3 = 251 Q3 – Q1 = 251 – 239 = 12
Exemple 2 : Le tableau ci-dessous indique la durée (en minutes) de connexion internet par jour de 43 familles interrogées
Durée en minutes
40 60 80 120 180 200 240 300
Effectif 2 9 11 7 5 2 4 3
Effectif
cumulé 2 11 22 29 34 36 40 43
Nous avons vu dans le paragraphe précédent que Q1 = 60 et Q3 = 180 Q3 – Q1 = 180 – 60 = 120
3) Variance
a) Définition
Soit la série statistique définie dans le tableau suivant :
Valeur 𝑥1 𝑥2 . . . 𝑥𝑝
Effectif 𝑛1 𝑛2 . . . 𝑛𝑝
Effectif total : 𝑵 = 𝒏 𝟏+ 𝒏 𝟐+ . . . . + 𝒏𝒑 Soit
𝒙 ̅
la moyenne de cette série . Le réel V = 𝟏𝑵
[ 𝒏
𝟏(𝒙
𝟏− 𝒙 ̅)
𝟐+ 𝒏
𝟐(𝒙
𝟐− 𝒙 ̅)
𝟐+ ⋯ + 𝒏
𝒊(𝒙
𝒊− 𝒙 ̅)
𝟐+ ⋯ + 𝒏
𝒑(𝒙
𝒑− 𝒙 ̅)
𝟐]
est appelé variance de cette série statistique.b) Exemple et méthode pour mieux comprendre la formule
Valeurs 9 11 13 15 17 total
Effectifs 6 4 7 2 1 20
Explication de la formule :
● N = 6 + 4 +7 +2 +1 = 20
● 𝑥 = 9×6 + 11×4 + 13×7 + 15×2 + 17×1
20 = 11,8
● Complétons le tableau : Valeurs
(𝒙𝒊) 9 11 13 15 17 total
Effectifs
(𝒏𝒊) 6 4 7 2 1 20
𝒙𝒊− 𝒙 9-11,8 = -2,8
11-11,8=- 0,8
13-11,8=
1,2
15-11,8=
3,2
17-11,8=
5,2
(𝒙𝒊− 𝒙)² 7,84 0,64 1,44 10,24 27,04
● On applique la formule : V =
1
20 ( 6 × 7,84 + 4 × 0,64 + 7 × 1,44 + 2 × 10,24 + 1 × 27,04) V = 107,2
20
= 5,36La variance est égale à 5,36
4) Ecart type
a) Définition
L’écart type , qui se note 𝝈 , est donné par la formule : 𝝈 = √𝑽
b) Exemple
Reprenons l’exemple précédent :
Valeurs 9 11 13 15 17 total
Nous avons trouvé la variance : V = 5,36
Donc l’écart type est : 𝜎 = √𝑉
𝜎 = √5,36 𝜎 ≈ 2,3
L’écart type est donc environ égal à 2,3
Remarque importante :
La variance et l’écart type permettent de mesurer la « dispersion » des valeurs de la série autour de la moyenne.
Si les valeurs de la série possèdent une unité, l’écart type s’exprime dans la même unité.