Caractéristiques de dispersion Chapitre 3
Chapitre 3
1
Compléments du cours
Prof. Mohamed El Merouani Département de Statistique et Informatique
Faculté Polydisciplinaire de Tétouan
Boîte de
Boîte de Tuckey Tuckey ou diagramme de ou diagramme de Box &
Box & Wiskers Wiskers
• Considérons le diagramme en boîte ci-
dessous, qui est la version la plus simple de la boîte de Tuckey, appliquée à la variable X.
Boîte de
Boîte de Tuckey Tuckey ou diagramme de Box ou diagramme de Box
&
& Wiskers Wiskers
3
Boîte de
Boîte de Tuckey Tuckey ou diagramme de Box ou diagramme de Box
&
& Wiskers Wiskers
• On distingue sur ce schéma la « boîte de Tuckey » qui est le rectangle construit sur le premier quartile Q1et le troisième Q3.
4 Prof. Mohamed El Merouani
Exemple1: (cas de variable discrète
"pondérée") :
• Calculer les quartiles Q1, Q2et Q3de la série statistique suivante :
5
xi ni nicc
3 4 8 10 11 20
3 7 30 20 15 25
3 10 40 60←
→75 100 N=100
1)
On cherche ce 25 entre les nicc
⇒il n’existe pas
exactement mais 40 est la 1èrevaleur qui dépasse ce 25
alors Q1=8
4 25 100 4 = = N
2)
⇒ ce 50 n’existe pas exactement parmi les nicc, alors la 1ère valeur qui la dépasse est 60, donc
Q2=10=Mé 3)
Dans ce cas cette valeur existe exactement parmi les nicc, alors
2 50 2 100
4 × = =
N
75 3 25 4 3
3 100
4 × = × = × = N
5 , 2 15
20 11
3 = + =
Q
Exemple2 (cas de variable continue) :
Calculons Q1, Q2et Q3 de la distribution statistique suivante :
7
[ei-1, ei[ ni nicc [0, 10[
[10, 30[
[30, 35[
[35, 80[
[80,100[
[100, 150[
4 8 13
5 3 7
4 12 *
25 30**
33 40 N= 40
Q1= ?
cette valeur n’apparaît pas parmi les nicc, mais la 1ère valeur qui la dépasse est 12.
D’où, on applique, dans la classe [10,30], la formule:
4 10 40 4 = = N
4 1 25
1
1 − =
+
= − − i
i i
i a
n cc N n
e Q
2) Q2?
⇒ Cette valeur n’existe pas non plus parmi les nicc, mais la 1ère valeur qui la dépasse est 25.
Donc, on applique la formule dans la classe [30,25] :
8
2 20 2 40
4 × = = N
i i
i
i a
n cc N n
e Mé Q
1 1
2 2 −
−
+ −
=
=
13 5 12 30+ 20− ×
=
08 ,
2 ≅33 Q
Prof. Mohamed El Merouani
3) Q3?
Cette fois-ci, cette valeur existe exactement parmi les nicc, la classe qui contient Q3 est [35,80] .
Alors, on prend Q3 =ei=80
9
4 30 3 3 40
4 × = × = N
Prof. Mohamed El Merouani
Boîte de
Boîte de Tuckey Tuckey ou diagramme de Box ou diagramme de Box
&
& Wiskers Wiskers
• L’intervalle interquartile =Q3-Q1=80-25=55
• La dérivation quartile ou le semi-interquartile est:
• L’écart interquartile relatif est:
11
5 , 2 27
55 2
1
3 −Q = =
Q
66 , 08 1 , 33
55
2 1
3 − ≅ ≈
Q Q Q
Prof. Mohamed El Merouani
Exemple
Exemple de calcul de la variance: de calcul de la variance:
• Calculer la variance par la formule non-
simplifiée et par la formule simplifiée, pour la série suivante :
12
[ei-1, ei[ ni ci ci2 nici nici2
[0, 10[
[10, 20[
[20, 30[
[30, 40[
1 2 3 4
5 15 25 35
25 225 625 1225
5 30 75 140
-20 -10 0 10
400 100 0 100
400 200 0 400
25 450 1875 4900
N=10 250 1000 7250
X
ci−
(
ci−X)
2 ni(
ci−X)
2Prof. Mohamed El Merouani
• La moyenne
• Formule non-simplifiée de la variance
• Formule simplifiée de la variance
13
k 2 1 i
2 i
ic X
N n
Var(X) 1 −
=
∑
=
i k
i ic N n
X
∑
=
=
1
1
( ) ( )
21
1 n c X
X N
Var i
k
i
i −
=
∑
=
Prof. Mohamed El Merouani
Exemple
Exemple de calcul de la variance:: de calcul de la variance::
[ei-1, ei[ ni ci ci2 nici nici2
[0, 10[
[10, 20[
[20, 30[
[30, 40[
1 2 3 4
5 15 25 35
25 225 625 1225
5 30 75 140
-20 -10 0 10
400 100 0 100
400 200 0 400
25 450 1875 4900
N=10 250 1000 7250
X
ci−
(
ci−X)
2 ni(
ci−X)
2• Donc, par la formule non simplifiée, la variance est:
• Et par la formule simplifiée, elle sera:
• D’où, l’écart-type est
15
100 Var(X)= =
10 1000
10 100 Var(X) = =
X = σ
( ) X = 725 − ( ) 25
2= 725 − 625 = 100
Var
10 25 250 1
1
=
=
=
∑
= i
k
i ic N n
• Alors, la moyenne est X
Pour l’exemple de calcul de la Pour l’exemple de calcul de la
variance variance::
• Le coefficient de variation
• Soit donc un coefficient de variation de 40%
supérieur à 30%
• Donc, la série étudiée et non-homogène!
16
4 , 25 0 10 =
=
= X CV σ(X)
Prof. Mohamed El Merouani