Statistique, analyse exploratoire des
donn´ees et probabilit´es
Val´erie Henry
ULg, UNamur, CREM
Interpr´eter et construire un graphique
| | | | |TG AG PGAPGSA
21350
10150
350
1750
| | |||Effectifs
R´
eponse de 35 000
Wal-lons `
a la question
sui-vante : “Estimez-vous
que les faits qui sont
re-proch´
es `
a certains
ex-dirigeants de La
Caro-lor´
egienne sont
Tr`
es graves — Assez
| | | | | | | |0 1 2 3 4 5 6 7 8
10
20
30
40
50
60
70
| | | | | | |Effectifs
Nombre de fr`
eres et
sœurs de 197 ´
etudiants
150 160 170 180 190 200
0
1
2
3
4
5
6
| | | | | | | ni liTailles de 197 ´
etudiants
Construction de la covariance | | | | | | | | |
0 1 2 3 4 5 6 7 8 9
25
50
75
100
125
150
175
200
| | | | | | | |Eff. cum.
b b b b b b b b bNombre de fr`eres
et sœurs de 197
´etudiants
| | | | | | | | | | | b b b b b b0
0.2
0.4
0.6
0.8
1
0.1
0.3
0.5
0.7
0.9
| | | | | |150 160 170 180 190 200
Freq.cum.
Tailles
de
197
´etudiants
Qualitatif
Quantitatif
Nominal
Ordinal Discret
Continu
Effectifs
ou fr´eq.
barres ou secteurs
bˆatons ou
secteurs
Histo-gramme
Polygone
Eff. cum
ou fr´eq.
cum.
////////
Courbe
cumula-tive
(en
escalier)
Ogive
(continue,
affine par
morceaux)
BAM concentr´ee
| | | | |
Construction de la covariance
BAM concentr´ee
| | | | |d
(1)
Q
1
x
˜
Q
3
d
(n)
|a
2
|a
1
1.5(Q3
− Q1)
1.5(Q3
− Q1)
BAM concentr´ee
| | | | |d
(1)
Q
1
x
˜
Q
3
d
(n)
|a
2
|a
1
1.5(Q3
− Q1)
1.5(Q3
− Q1)
a
1
= Q1
− 1.5(Q3
− Q1)
Construction de la covariance
BAM dispers´ee
| | | | |
BAM dispers´ee
| | | | |d
(1)
Q
1
x
˜
Q
3
d
(n)
|a
2
|a
1
1.5(Q3
− Q1)
1.5(Q3
− Q1)
Construction de la covariance
BAM dispers´ee
| | | | |d
(1)
Q
1
x
˜
Q
3
d
(n)
|a
2
|a
1
1.5(Q3
− Q1)
1.5(Q3
− Q1)
| | |d
(2)
d
(3)
d
(n−1)
BAM dispers´ee
| | | | |d
(1)
Q
1
x
˜
Q
3
d
(n)
|a
2
|a
1
1.5(Q3
− Q1)
1.5(Q3
− Q1)
| | |d
(2)
d
(3)
d
(n−1)
*
*
*
Construction de la covariance
Taux de chˆomage (en %) observ´es dans 13 pays industrialis´es pour les
25-64 ans, suivant le niveau d’´etudes
Taux de chˆomage selon le niveau d’´etudes
Pays
primaire
secondaire
sup. non univ.
univ.
Allemagne
13,3
7,9
5,2
4,7
Belgique
13,4
7,5
3,5
3,6
Canada
13
8,6
7,5
4,6
Danemark
14,6
8,3
5,3
4,3
Espagne
20,6
18,5
16,6
13,8
´
Etats-Unis
10
5
3,6
2,5
France
14
8,9
5,9
7
Gr`ece
6,3
9
10,1
7,1
Irlande
16,4
7,6
5
3,4
Norv`ege
6,5
4
3,4
1,7
Royaume Uni
12,2
7,4
4,1
3,5
Su`ede
10,1
8,7
4,8
4,2
Suisse
5,8
2,8
1,5
2,6
Supposons que la moyenne des notes obtenues `a l’examen du
cours de statistique en janvier soit de 70 sur 100 avec un
´ecart-type de 5.
Construction de la covariance
Supposons que la moyenne des notes obtenues `a l’examen du
cours de statistique en janvier soit de 70 sur 100 avec un
´ecart-type de 5.
Combien d’´etudiants ont obtenu une note entre 60 et 80 ?
In´
egalit´
e de Tchebychev
Pour une s´erie S, de moyenne ¯
x
et de variance σ
2
et pour
tout t > 0, la proportion d’observations qui appartiennent
`a l’intervalle [¯
x
−tσ, ¯
x
+tσ] est sup´erieure ou ´egale `a 1−
1
Supposons que la moyenne des notes obtenues `a l’examen du
cours de statistique en janvier soit de 70 sur 100 avec un
´ecart-type de 5.
Combien d’´etudiants ont obtenu une note entre 60 et 80 ?
In´
egalit´
e de Tchebychev
Pour une s´erie S, de moyenne ¯
x
et de variance σ
2
et pour
tout t > 0, la proportion d’observations qui appartiennent
`a l’intervalle [¯
x
−tσ, ¯
x
+tσ] est sup´erieure ou ´egale `a 1−
1
t
2.
Construction de la covariance
D´emonstration
Soit S = {d1
, d
2
, . . . , d
n}, ordonnons les observations de telle
sorte que
|di
− ¯
x
| ≤ tσ
∀ 1 ≤ i ≤ k
|di
− ¯
x
| > tσ
∀ k + 1 ≤ i ≤ n
Par d´efinition, on a nσ
2
=
Pn
i=1
(di
− ¯
x)
2
. D`es lors,
nσ
2
>
n
X
i=k+1
(di
− ¯
x
)
2
nσ
2
>
(n − k)t
2
σ
2
n
t
2
>
n
− k
k > n
−
n
t
2
Nuage de points
b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b bConstruction de la covariance
Nuage de points
b b b b b b b b b b b b¯
x
¯
y
Nuage de points
b b b b b b b b b b b b¯
x
¯
y
Construction de la covariance
Nuage de points
b b b b b b b b b b b b¯
x
¯
y
(di
− ¯
x
) > 0
Nuage de points
b b b b b b b b b b b b¯
x
¯
y
(di
− ¯
x
) > 0
(ei
− ¯
y
) > 0
Construction de la covariance
Nuage de points
b b b b b b b b b b b b¯
x
¯
y
(di
− ¯
x
) > 0
(ei
− ¯
y
) > 0
Nuage de points
b b b b b b b b b b b b¯
x
¯
y
(di
− ¯
x
) > 0
(ei
− ¯
y
) > 0
(di
− ¯
x
) < 0
Construction de la covariance
Nuage de points
b b b b b b b b b b b b¯
x
¯
y
(di
− ¯
x
) > 0
(ei
− ¯
y
) > 0
(di
− ¯
x
) < 0
(ei
− ¯
y
) < 0
Nuage de points
b b b b b b b b b b b b¯
x
¯
y
(di
− ¯
x
) > 0
(ei
− ¯
y
) > 0
(di
− ¯
x
) < 0
(ei
− ¯
y
) < 0
Globalement,
n
P
(di
− ¯
x
)(ei
− ¯
y
) > 0
Construction de la covariance b b b b b b b b bb b b b
b b b b b b b b bb b b b
(di
− ¯
x
) > 0
Construction de la covariance b b b b b b b b bb b b b
(di
− ¯
x
) > 0
(ei
− ¯
y
) < 0
b b b b b b b b bb b b b
(di
− ¯
x
) > 0
(ei
− ¯
y
) < 0
(di
− ¯
x
) < 0
Construction de la covariance b b b b b b b b bb b b b
(di
− ¯
x
) > 0
(ei
− ¯
y
) < 0
(di
− ¯
x
) < 0
(ei
− ¯
y
) > 0
b b b b b b b b bb b b b
(di
− ¯
x
) > 0
(ei
− ¯
y
) < 0
(di
− ¯
x
) < 0
(ei
− ¯
y
) > 0
Globalement,
n
X
i=1
(di
− ¯
x
)(ei
− ¯
y
) < 0
Construction de la covariance b b b b b b b b bb b b b
(di
− ¯
x
) > 0
(ei
− ¯
y
) < 0
(di
− ¯
x
) < 0
(ei
− ¯
y
) > 0
Globalement,
n
X
i=1
(di
− ¯
x
)(ei
− ¯
y
) < 0
σxy
=
1
n
n
X
i=1
(di
− ¯
x
)(ei
− ¯
y
)
et on a
|σxy| ≤ σx
σy
D`es lors,
b b b b b b b b bb b b b
(di
− ¯
x
) > 0
(ei
− ¯
y
) < 0
(di
− ¯
x
) < 0
(ei
− ¯
y
) > 0
Globalement,
n
X
i=1
(di
− ¯
x
)(ei
− ¯
y
) < 0
σxy
=
1
n
n
X
i=1
(di
− ¯
x
)(ei
− ¯
y
)
et on a
|σxy| ≤ σx
σy
D`es lors,
σxy
Construction de la covariance
Tableau de contingence
Le tableau ci-dessous d´ecrit la r´epartition d’une population
constitu´ee de 535 m´enages selon les deux variables suivantes :
X
repr´esente le nombre de pi`eces de l’habitation et Y
correspond au nombre d’enfants du m´enage.
Nombre de
Nombre d’enfants
pi`eces
0
1
2
3
4
1
7
3
2
1
0
2
24 32 21
2
1
3
16 35 54 26
4
4
9
28 74 55 12
5
4
12 46 13 12
6
2
6
16 11
7
Nombre de
Nombre d’enfants
pi`eces
0
1
2
3
4
1
7
3
2
1
0
2
24 32 21
2
1
3
16 35 54 26
4
4
9
28 74 55 12
5
4
12 46 13 12
6
2
6
16 11
7
σxy
=
Construction de la covariance