Statistique descriptive 1
Statistique descriptive et problèmes Vérifier les acquis n°1 à 6 p 154
I. Médiane, quartiles et diagramme en boîte
Activité n°1 p 155
A. Des paramètres de tendance centrale : médiane, quartiles Définition
La liste des 𝑵 données est rangée dans l’ordre croissant.
Si la série est de taille impaire (𝑵 = 𝟐𝒏 + 𝟏), la médiane est la donnée de rang 𝒏 + 𝟏
Si la série est de taille paire (𝑵 = 𝟐𝒏), la médiane est la demi-somme des données de rang 𝒏 et de rang 𝒏 + 𝟏
Exemple
Le tableau ci-dessous présente le nombre de buts par match durant la Coupe du monde de football de 2010 : Nombre de buts
xi
0 1 2 3 4 5 6 7
Nombre de matchs ni
7 17 13 14 8 6 0 1
Effectif cumulé
croissant 7 24 37 51 59 65 65 66
L’effectif total est 7 + 17 + 13 + 14 + 8 + 6 + 1 = 66 = 2 × 33
La médiane est donc la demi-somme de la 33ème et de la 34ème valeur 𝑀𝑒 =2+2
2 = 2
Définitions
La liste des 𝑵 données est rangée dans l’ordre croissant.
Le premier quartile est la plus petite donnée 𝑄1 de la liste telle qu’au moins un quart des données de la liste sont inférieures ou égales à 𝑸𝟏.
Le troisième quartile est la plus petite donnée 𝑄3 de la liste telle qu’au moins trois quarts des données de la liste sont inférieures ou égales à 𝑸𝟑.
Exemple
Pour la série étudiée, l'effectif total est égal à 66.
Le premier quartile 𝑄1 est la 17e valeur. En effet, 1
66 16, 5 17
4 . Donc 𝑄1 = 1.
Le troisième quartile 𝑄3 est la 50e valeur. En effet, 3
66 49, 5 50
4 . Donc 𝑄3 = 3.
Remarque
La médiane et les quartiles ne sont pas sensibles aux valeurs extrêmes.
Statistique descriptive 2 B. Un paramètre de dispersion : l’écart interquartile
Définition
L’écart interquartile est la différence entre le troisième quartile et le premier quartile : 𝑄3− 𝑄1
Exemple
Pour la série étudiée, l’écart interquartile est 𝑄3− 𝑄1 = 3 − 1 = 2 C. Diagramme en boîte
Pour visualiser ces paramètres et la répartition des données autour de la médiane, on réalise un diagramme en boîte. Ce type de diagramme est souvent utilisé pour comparer plusieurs séries.
Exemple
Pour la série étudiée, le diagramme en boîte est :
Voir exercice résolu 1 p 157
Exercices n°10 à 17 – 19 à 20 – 22 p 162 – 163
II. Moyenne, variance et écart-type
Activité n°2 p 155
On utilise la série statistique suivante :
Valeur 𝑥1 𝑥2 … 𝑥𝑝 TOTAL
Effectif 𝑛1 𝑛2 … 𝑛𝑝 𝑵 = 𝒏𝟏+ 𝒏𝟐+ ⋯ + 𝒏𝒑
A. Un indicateur de tendance centrale : la moyenne Définition
La moyenne de cette série statistique est le nombre réel, noté 𝑥̅, tel que 𝒙
̅ =𝒏𝟏𝒙𝟏+ 𝒏𝟐𝒙𝟐+ ⋯ + 𝒏𝒑𝒙𝒑 𝑵
Exemple
La moyenne de buts par match est égale à :
𝑥̅ = 7×0+17×1+13×2+14×3+8×4+6×5+1×7
66 =154
66 = 7
3≈ 2,3
Remarque
La moyenne est très sensible aux valeurs extrêmes.
Remarque
Pour une série regroupée en classes, on obtient une valeur approchée de la moyenne de la série en prenant pour les 𝑥𝑖, les centres (ou les milieux) des classes.
Statistique descriptive 3 B. Des paramètres de dispersion : variance, écart-type
Définition
La variance de cette série statistique est le nombre réel, noté V, tel que : 𝑽 =𝒏𝟏(𝒙𝟏− 𝒙̅)𝟐+ 𝒏𝟐(𝒙𝟐− 𝒙̅)𝟐+ ⋯ + 𝒏𝒑(𝒙𝒑− 𝒙̅)𝟐
𝑵
L’écart-type d’une série statistique est le nombre réel, noté 𝜎, tel que 𝝈 = √𝑽
Remarque
L’avantage de l’écart-type est de s’exprimer dans la même unité que les 𝑥𝑖. Exemple
La variance de la série est :
𝑉 =7 × (0 −7 3)
2
+ 17 × (1 −7 3)
2
+ 13 × (2 −7 3)
2
+ 14 × (3 −7 3)
2
+ 8 × (4 −7 3)
2
+ 6 × (5 −7 3)
2
+ 0 × (6 −7 3)
2
+ 1 × (7 −7 3)
2
66 ≈ 2,4646
L’écart-type est 𝜎 ≈ √2,4646 ≈ 1,57 buts.
Voir exercice résolu 1 p 159
Exercices n°23 – 29 – 33 p 164 Problèmes n°30 – 32 – 34 p 164 – 165
C. Résumé d’une série statistique
On résume souvent une série statistique par un paramètre de tendance centrale associé à un paramètre de dispersion.
Deux choix sont couramment proposés :
le couple (moyenne ; écart-type) qui a l’inconvénient d’associer deux paramètres sensibles aux valeurs extrêmes
le couple (médiane ; écart interquartile) qui n’a pas ce défaut mais dont la détermination est moins pratique.