1
Chapitre II : INDICATEURS STATISTIQUES I- Indicateurs de tendance centrale
1) Moyenne
On considère dans la suite, la série statistique définie par le tableau ci-contre.
L’effectif total est = + + . . . + .
Définition : La moyenne de la série statistique est le nombre réel, noté ̅ défini par :
̅ = + + . . . +
Exemple 1 : Une équipe de rugby dresse le bilan de la dernière saison :
̅ =2 × 0 + 5 × 1 + 9 × 2 + 5 × 3 + 3 × 4 + 1 × 5
25 = 2,2
Exemple 2 : Les résultats d’une épreuve d’examen sont donnés par le tableau ci-dessous :
2) Mode, classe modale
Le mode ou valeur modale, désigne la valeur que la variable prend le plus fréquemment c’est-à-dire qui présente le plus fort effectif.
De manière similaire, dans le cas de données regroupées, la classe modale désigne la classe la plus représentée.
Dans l’exemple 1, le mode est 2, c’est la valeur dont l’effectif est le plus important.
Dans l’exemple 2, la classe modale est [8 ;12[.
3) Médiane, quartiles
Définition : On appelle médiane tout réel tel que :
Au moins 50% des termes de la série ont une valeur inférieure ou égale à et au moins 50%
des termes de la série ont une valeur supérieure ou égale à .
Valeur …
Effectif …
Nombre d’essais marqués par match 0 1 2 3 4 5
Nombre de matchs 2 5 9 5 3 1
Note sur 20 Effectifs ni
[0 ;4[ 2
[4 ;8[ 5
[8 ;12[ 14
[12 ;16[ 11
[16 ;20] 4
TOTAL : 36
Pour le calcul de la moyenne, on prend le centre des classes :
̅ =2 × + 5 × + 14 × + 11 × + 4 × 36
≈ 11,11
2
Remarque : La médiane partage l'ensemble des termes en deux sous-ensembles de même effectif. La détermination de la médiane est différente suivant que l'effectif total est pair ou impair :
• Lorsque l'effectif total est impair, il n'y a pas de difficulté, la médiane est le terme central, à savoir le terme de rang
• Lorsque l'effectif total est pair, l'usage veut que l'on choisisse pour médiane la moyenne des deux termes centraux, à savoir les termes de rang
et
+ 1. Mais tout réel compris entre ces deux termes conviendrait également.
Dans l’exemple 1, l’effectif est impair : !
= 13, la médiane est donc la 13ème valeur : 2.
Définition : On appelle premier quartile " la plus petite valeur de la série tel qu’au moins 25% des termes de la série ont une valeur inférieure ou égale à ".
On appelle troisième quartile "# la plus petite valeur de la série tel qu’au moins 75% des termes de la série ont une valeur inférieure ou égale à "#.
Remarques :
• Le deuxième quartile " ne se définit pas puisqu'il s'agit de la médiane .
• Les trois quartiles partagent l'ensemble des valeurs en quatre sous-ensembles de (presque) même effectif.
• Lorsque l'effectif total n'est pas un multiple de 4, il n'y a pas de difficulté, les quartiles
" et "# sont les termes de rang immédiatement supérieur à
$ et #
• Lorsque l'effectif total est un multiple de 4, les quartiles " et "#$ sont les termes de rang
$ et #
$.
Dans l’exemple 1, l’effectif est 25 : !
$ = 6,25, " est donc la 7ème valeur de la série à savoir 1.
#×!
$ = 18,75, " est donc la 19ème valeur de la série à savoir 3.
II- Indicateurs de dispersion
1) Étendue
L’étendue d’une série statistique est l’écart entre la plus grande et la plus petite valeur observée.
Dans l’exemple 1, l’étendue est 5 − 0 = 5.
2) Écart interquartile
L’écart interquartile correspond à l’étendue de la « moitié centrale » de la série statistique, c’est-à-dire la série statistique « amputée » de ses deux quarts extérieurs d’observations, soit les 50 % d’observations centrales : c’est tout simplement "#− ".
Dans l’exemple 1, l’écart interquartile est 3 − 1 = 2.
3
3) Écart-type
L’écart-type noté σ s’obtient avec une calculatrice ou un tableur, il indique la dispersion des valeurs de la série autour de la moyenne.
III- Représentation graphique
Diagramme en boîte : (ou boîte à moustaches, ou encore boîte de TUKEY)
Dans l’exemple 1, le diagramme en boîte est :
Min Max
" "#
Au moins 25%
des données Au moins 50% des données Au moins 25%
des données
Au moins 50% des données Au moins 50% des données
4
IV – Courbe de Gauss et répartition
Dans certaines situations observées, la représentation d’une série statistique peut prendre la forme d’une courbe en cloche dite courbe de Gauss :
- Les valeurs sont réparties de façon à peu près symétriques autour de la moyenne - Environ 95 % des valeurs sont dans l’intervalle [ − 2*; + 2*]
Remarque :
En pratique, dans ce contexte, il suffit de déterminer la moyenne et l’écart-type de la série pour en déduire un intervalle contenant environ 95 % des valeurs de la série.
− 2* + 2*