STATISTIQUE DESCRIPTIVE
Abdelhak FAHSI
D ´epartement de Mathematiques Facult ´e des Sciences et Techniques Mohammedia
Module M321 : Probabilit ´e et Statistique pour BCG
www.alloacademy.com
Les statistiques= Collecte des donn ´ees statistiques (Recensement ou sondage)
La statistique= Traitement des donn ´ees statistiques (m ´ethodes math ´ematiques)
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
chimie, sociologie, m ´edecine, pharmacie, agronomie, industrie, ...
La statistique comporte deux branches :
La Statistique descriptive : Elle consiste `a r ´esumer, ordonner, pr ´esenter et analyser de fac¸on claire des donn ´ees statistiques relatives `a une population donn ´ee ( ´echantillon) sous forme de tableaux, de graphiques ou de param `etres. (sans tirer de conclusion pour une population plus grande).
La statistique math ´ematique : Elle permet graces aux m ´ethodes math ´ematiques (lois de probabilit ´e) de faire des pr ´evisions et tirer des conclusions sur toute la population `a partir des r ´esultats recueillis sur un
´echantillon.
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
Collecte des donn ´ees (les statistiques) :
recueillir les informations ad ´equates sur un ´echantillon qui serviront de base `a l’ ´etude.
2 Traitement des donn ´ees (la statistique) :
Statistique descriptive : techniques permettant de traiter les donn ´ees recueillies, de les mettre sous forme de tableaux, de graphiques et de d ´egager les
caract ´eristiques essentielles (moyenne, m ´ediane, variance,. . . )
Statistique math ´ematique : techniques permettant de tirer des conclusions sur toute la population `a partir de
Objectif du cours :
Apprendre les principales techniques de la statistique descriptive `a une dimension et `a deux dimensions.
Etre capable de mettre en oeuvre ces techniques deˆ mani `ere appropri ´ee dans un contexte donn ´e.
Manipuler les techniques de statistiques descriptives au moyen d’un language informatique (language R).
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
1 Statistique descriptive `a une dimension I- Terminologie
II- Organisation des donn ´ees
II.2- Tableaux statistiques II.3- Repr ´esentations graphiques
III- R ´eduction des donn ´ees
III.1- Param `etres de position III.2- Param `etres de dispersion III.3- Param `etres de forme III.4- Param `etres de concentration
2 Statistique descriptive `a deux dimensions I- Tableau de contingence
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
Chapitre 1
Statistique descriptive `a une dimension
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
I- Terminologie
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
1. Population :Ensemble des personnes, objets ou ´el ´ements sur lesquels on veut effectuer l’ ´etude.
2. Individu :Chacun des ´el ´ements de la population (unit ´e statistique).
3. Echantillon : Groupe resreint d’individus pr ´elev ´es dans la population d ´efinie au pr ´ealable.
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
Exemple
On veut ´etudier le poids de 100 enfants ˆag ´es de 1 `a 5 ans.
Population : les enfants ˆag ´es de 1 `a 5 ans.
Individu: chaque enfant ˆag ´e de 1 `a 5 ans.
Echantillon : les 100 enfants ˆag ´es de 1 `a 5 ans.
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
4. Caract `ere (ou variable) :Caract ´eristique relative `a chacun des individus de la population et sur laquelle on veut faire porter l’ ´etude. Il est soit observ ´e soit mesur ´e.
Les caract `eres (ou variables) sont d ´esign ´es par une lettre X , Y ,. . .
Exemple
Le poids des enfants ˆag ´es de 1 `a 5 ans
Le revenu mensuel des salari ´es d’une entreprise La couleur des voitures vendues au Maroc en 2007 La puissance fiscale, etc ...
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
5. S ´erie statistique :C’est une correspondance qui `a chaque individu de la population ´etudi ´ee fait associer une valeur du caract `ere ´etudi ´e.
Les valeurs d’une s ´erie statistique pour un caract `ere X sont not ´ees :
x(1),x(2), . . . ,x(N)
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
Exemple
On consid `ere le caract `ere X =” ´etat civil” de 20 personnes d’une entreprise.
On consid `ere la codification : C=c ´elibataire, M=mari ´e(e), V=veuf(ve), D=divorc ´e(e).
On suppose la s ´erie statistique suivante :
M M D C C M C C C M
c M V M V D C C D M
On a : x(1) =M, x(2)=M, x(3)=D, . . . , x(20)=M,
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
6. Modalit ´es : Ce sont les diff ´erentes valeurs distinctes prises par le caract `ere.
Les modalit ´es d’un caract `ere X sont not ´ees : x1,x2, . . . ,xk
k d ´esigne le nombre de modalit ´es du caract `ere.
Exemple
- le caract `ere ”X =couleur” peut avoir comme modalit ´es : noir, rouge, bleu, blanc, gris, autres.
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
Remarque
Les modalit ´es d’un caract `ere doivent ˆetre :
Incompatibles : (chaque individu a une seule modalit ´e).
Exhaustives(tous les cas sont pr ´evus).
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
On distingue deux types de caract `ere :
Caract `ere qualitatif : C’est un caract `ere non mesurable.
Les modalit ´es ne sont pas des valeurs num ´eriques.
Caract `ere quantitatif : C’est un caract `ere mesurable. Les modalit ´es sont toutes des valeurs num ´eriques.
Pour chaque type de caract `ere, on distingue deux types :
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
Caract `ere qualitatif :
1 Caract `ere qualitatif ordinal : les modalit ´es peuvent ˆetre ordonn ´ees selon une certaine hi ´erarchie.
Exemple
Niveau d’ ´etude: primaire, secondaire, sup ´erieur.
Etat m ´ecanique d’une Voiture: mauvais, moyen, bon, excellent.
2 Caract `ere qualitatif nominal : les modalit ´es ne peuvent pas ˆetre ordonn ´ees: elles sont nomm ´ees mais pas ordonn ´ees.
Exemple
Nationalit ´e: marocaine, allemande, franc¸aise Groupe sanguin: A, B, O, AB
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
Caract `ere quantitatif :
1 Caract `ere quantitatif discret : L’ensemble des valeurs possibles (modalit ´es) est d ´enombrable. On dit aussi variable statistique discr `ete.
Exemple
Nombre d’enfants par famille, nombre d’ ´etudiants par classe, . . .
2 Caract `ere quantitatif continu : L’ensemble des valeurs possibles (modalit ´es) est continu. On dit aussi variable statistique continue.
Exemple
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
Remarque
Lorsque le nombre des modalit ´es d’un caract `ere
quantitatif est ´elev ´e (sup ´erieur `a 15), on est g ´en ´eralement conduit `a regrouper les modalit ´es en classes de la forme
[xi;xi+1[, i=1,2, . . . ,k
Les classes[xi;xi+1[peuvent avoir une m ˆeme amplitude ou des amplitudes diff ´erentes.
Exemple
Le caract `ere ”Revenus mensuels (en dh) des employ ´es d’une entreprise” peut avoir comme modalit ´es :
[4000;5000[,[5000;6000[,[6000;8000[, 8000 et plus.
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
R `egles de construction des classes
Fixer un nombre de classes ni trop petit ni trop grand (g ´en ´eralement de 5 `a 15).
Choisir des bornes qui, autant que possible, permettront des calculs simples (de pr ´ef ´erence, d ´eterminer des classes d’amplitudes ´egales et multiples de 5, 10, 100, 1000).
Consid ´erer des classes adjacentes et, par convention, ferm ´ees `a gauche et ouvertes `a droite.
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
7. Effectif :L’effectif d’une modalit ´e xi, not ´e ni, est le nombre d’individus pr ´esentant cette modalit ´e.
L’effectif total, not ´e N, est le nombre total des individus de la population (appel ´e aussi taille de la population) :
k
X
i=1
ni =N
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
8. Fr ´equence ou proportion : La fr ´equence d’une modalit ´e xi, not ´ee fi, est le rapport fi = ni
N.
C’est la proportion des individus de la population pr ´esentant cette modalit ´e.
Remarque
La fr ´equence fi appartient `a l’intervalle[0,1].
Parfois, on note les fr ´equences en pourcentage (avec le symbole%) en les multipliant par 100.
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
Si le caract `ere est de typeordinal, on peut calculer les effectifs et les fr ´equences cumul ´es.
9. Effectif cumul ´e :L’effectif cumul ´e d’une modalit ´e xi, not ´ee Ni, est le nombre d’individus de la population pour lesquels la valeur du caract `ere est inf ´erieure ou ´egale `a xi :
Ni =
i
X
j=1
nj =Ni−1+ni
On a N1=n1et Nk =N.
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
10. Fr ´equence cumul ´ee :La fr ´equence cumul ´ee d’une modalit ´e xi, not ´ee Fi, est la proportion d’individus pour lesquels la valeur du caract `ere est inf ´erieure ou ´egale `a xi :
Fi = Ni N =
i
X
j=1
fj =Fi−1+fi
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
II- Organisation des donn ´ees
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
II.1- Tableaux statistiques
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
Les tableaux statistiques consistent `a r ´esumer et pr ´esenter les donn ´ees observ ´ees sous la forme num ´erique de distributions d’effectifs et/ou de fr ´equences :
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
Modalit ´es Effectifs Eff Cum Fr ´equences ...
ni Ni fi
x1 n1 N1=n1 f1
... ... ... ... ...
xi ni Ni =Ni−1+ni fi
... ... ... ... ...
xk nk Nk =N fk
Total N 1
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
Exemple1: Dans un atelier de contr ˆole, on a enqu ˆet ´e sur l’ ´etat m ´ecanique d’un ´echantillon al ´eatoire de 70 voitures.
Le contr ˆoleur obtient la s ´erie statistique suivante :
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
Bon Bon Moyen Bon Bon Mauvais
Excellent Moyen Bon Bon Excellent Moyen
Moyen Bon Excellent Mauvais Bon Bon
Bon Mauvais Excellent Bon Bon Excellent
Bon Moyen Mauvais Moyen Excellent Bon
Bon Moyen Excellent Bon Bon Excellent
Mauvais Moyen Excellent Bon Bon Moyen
Bon Excellent Bon Moyen Excellent Bon
Moyen Bon Excellent Bon Mauvais Moyen
Bon Bon Moyen Bon Bon Moyen
Mauvais Excellent Bon Moyen Bon
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
- Population ´etudi ´ee : Echantillon de 70 voitures.
- Caract `ere ´etudi ´e : ´Etat m ´ecanique.
- Modalit ´es : Mauvais, Moyen, Bon, Excellent.
- Type du caract `ere : Qualitatif ordinal.
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
Tableau statistique :
Etat Effectif Eff. cum. Fr ´equence Fr ´eq. cum. ...
M ´ecanique ni Ni fi Fi
Mauvais 7 7 0.1 0.1
Moyen 17 24 0.24 0.34
Bon 32 56 0.46 0.8
Excellent 14 70 0.2 1
Total 70 1
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
Exemple2: Dans un quartier compos ´e de 50 familles, on enqu ˆete sur le nombre d’enfants par famille.
Les valeurs de la variable statistique sont :
1 0 5 2 2 1 2 1 2 4
4 7 1 3 2 5 4 6 3 1
1 6 1 3 8 1 3 5 2 3
3 0 3 4 6 4 1 7 2 0
2 0 1 2 2 3 2 5 6 2
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
- Population ´etudi ´ee : Les 50 familles du quartier.
- Caract `ere ´etudi ´e : nombre d’enfants.
- Modalit ´es : 0, 1, 2, . . . ,8.
- Nature du caract `ere : Quantitatif discret.
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
Tableau statistique :
Nombre Effectif Eff. cum. Fr ´equence Fr ´eq. cum. ...
d’enfants ni Ni fi Fi
0 4 4 0.08 0.08
1 10 14 0.2 0.28
2 12 26 0.24 0.52
3 8 34 0.16 0.68
4 5 39 0.1 0.78
5 4 43 0.08 0.86
6 4 47 0.08 0.94
7 2 49 0.04 0.98
8 1 50 0.02 1
Total 50 1
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
Exemple3: En mesurant la taille de 50 ´etudiants de la FST, on a obtenu les r ´esultats suivants (en cm) :
152 151,5 160 165 170
159 168 161 164 156
158.5 167 157 170,5 161,5
169 156 158,5 160,5 152
156.5 166 152,5 170 165
154 170 165 155.5 166,5
162,5 152,5 168 169 158
157 161 154,5 162 158
153,5 157,5 163 155 153
160 169,5 154 161 162
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
- Population ´etudi ´ee : Echantillon de 50 ´etudiants.
- Caract `ere ´etudi ´e : La taille.
- Modalit ´es :Le nombre des modalit ´es observ ´ees ´etant ´elev ´e, il est donc n ´ecessaire de les grouper en classes.
- Nature du caract `ere : Quantitatif continu.
On peut consid ´erer les classes suivantes : [151;155[
[155;159[
[159;163[
[163;167[
[167;171[
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
Tableau statistique :
Taille Effectif Eff. cum. Fr ´equence Fr ´eq. cum. ...
(en cm) ni Ni fi Fi
[151;155[ 10 10 0.2 0.2
[155;159[ 12 22 0.24 0.44
[159;163[ 11 33 0.22 0.66
[163;167[ 7 40 0.14 0.8
[167;171[ 10 50 0.2 1
Total 50 1
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
II.2- Representations graphiques
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
Bien qu’un tableau statistique r ´esume toute l’information d’une distribution statistique, la repr ´esentation graphique permet de visualiser et de d ´eceler les principales
caract ´eristiques de la distribution statistique (tendance, sym ´etrie, dispersion, concentration, . . . ).
La repr ´esentation graphique des donn ´ees relatives `a un caract `ere repose sur la proportionnalit ´e des longueurs ou des aires aux effectifs (ou aux fr ´equences) des diff ´erentes modalit ´es du caract `ere.
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
Suivant le type du caract `ere ´etudi ´e, on utilise diff ´erents modes de repr ´esentations graphiques.
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
1. Caract `ere qualitatif :
a. Diagramme en tuyaux d’orgue (ou en rectangles) : On repr ´esente chaque modalit ´e par un rectangle dont la hauteur est ´egale `a l’effectif (ou `a la fr ´equence) de la modalit ´e et dont la base est constante
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
1. Caract `ere qualitatif :
Exemple1 : ´etat m ´ecanique de 81 voitures Etat Effectif Fr ´equence M ´ecanique ni fi
Mauvais 7 0.1
Moyen 17 0.24
Bon 32 0.46
Excellent 14 0.2
Total 70 1
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
1. Caract `ere qualitatif :
Voir GraphExcel1
7
17
32
14
0 5 10 15 20 25 30 35
Mauvais Moyen Bon Excellent
Effectif
A. Fahsi
www.alloacademy.com
1. Caract `ere qualitatif :
b. Diagramme circulaire ( ou sectoriel) :
Chaque modalit ´e est repr ´esent ´ee par un secteur dont l’angle est proportionnel `a l’effectif correspondant. La totalit ´e de la circonf ´erence (360◦) correspond `a l’effectif total.
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
1. Caract `ere qualitatif :
Exemple1 : ´etat m ´ecanique de 81 voitures
Etat Effectif Fr ´equence Angle M ´ecanique ni fi αi =360×fi
Mauvais 7 0.1 36◦
Moyen 17 0.24 87.4◦
Bon 32 0.46 164.6◦
Excellent 14 0.2 72◦
Total 70 1 360◦
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
1. Caract `ere qualitatif :
Voir GraphExcel2
Moyen 24%
Mauvais 10%
Excellent 20%
Bon 46%
Diagramme circulaire
A. Fahsi
www.alloacademy.com
1. Caract `ere qualitatif ordinal
c. Diagramme en rectangles des effectifs cumul ´es : Pour un caract `ere qualitatif ordinal, on peut tracer le diagramme en rectangles des effectifs cumul ´es :
Soit x1<x2< . . . <xk les modalit ´es ordonn ´ees du caract `ere.
On repr ´esente chaque modalit ´e par un rectangle dont la hauteur est ´egale `a l’effectif cumul ´e (ou `a la fr ´equence cumul ´ee) de la modalit ´e et dont la base est constante.
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
1. Caract `ere qualitatif ordinal
Exemple1 : ´etat m ´ecanique de 81 voitures
Etat Effectif Eff. cum. Fr ´equence Fr ´eq. cum.
M ´ecanique ni Ni fi Fi
Mauvais 7 7 0.1 0.1
Moyen 17 24 0.24 0.34
Bon 32 56 0.46 0.8
Excellent 14 70 0.2 1
Total 70 1
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
1. Caract `ere qualitatif ordinal
Voir GraphExcel2
7
24
56
70
0 10 20 30 40 50 60 70 80
Mauvais Moyen Bon Excellent
Effectif cumulé
A. Fahsi
www.alloacademy.com
2. Caract `ere quantitatif discret :
a. Diagramme en b ˆatonnets :
Chaque modalit ´e est repr ´esent ´ee par un trait vertical (b ˆatonnet) dont la hauteur est ´egale `a l’effectif (ou `a la fr ´equence) de la modalit ´e.
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
2. Caract `ere quantitatif discret :
Exemple2 : Nombre d’enfants par famille
Nombre Effectif Eff. cum. Fr ´equence Fr ´eq. cum. ...
d’enfants ni Ni fi Fi
0 4 4 0.08 0.08
1 10 14 0.2 0.28
2 12 26 0.24 0.52
3 8 34 0.16 0.68
4 5 39 0.1 0.78
5 4 43 0.08 0.86
6 4 47 0.08 0.94
7 2 49 0.04 0.98
8 1 50 0.02 1
Total 50 1
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
2. Caract `ere quantitatif discret :
5 10 15Effectif n
i
0.1 0.2 0.3 Fréquence f
i
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
2. Caract `ere quantitatif discret :
b. Polygone de fr ´equences :
Le polygone de fr ´equences est construit en joignant par des segments de droites les sommets des b ˆatons du diagramme en b ˆatons.
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
2. Caract `ere quantitatif discret :
5 10 15
ni
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
2. Caract `ere quantitatif discret :
c. Courbe cumulative - Fonction de r ´epartition : Soient x1<x2< . . . <xk les modalit ´es ordonn ´ees du caract `ere.
A partir des fr ´equences cumul ´ees F` i, on d ´efinit la fonction de r ´epartition F(x), d ´efinie de IR vers[0,1], par :
F(x) =0, si x <x1
F(x) =Fi, si xi ≤x <xi+1 (1≤i≤k −1) F(x) =1, si x ≥xk
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
2. Caract `ere quantitatif discret :
La courbe cumulative (ou la courbe des fr ´equences cumul ´ees) est la repr ´esentation graphique de la fonction de r ´epartition F(x).
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
2. Caract `ere quantitatif discret :
Remarque :
La courbe cumulative est aussi la repr ´esentation graphique des effectifs cumul ´es. On trace alors la fonction G(x)d ´efinie de IR vers[0,N]par :
G(x) =0, si x <x1
G(x) =Ni, si xi ≤x <xi+1 (1≤i ≤k−1) G(x) =N, si x ≥xk
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
2. Caract `ere quantitatif discret :
Exemple2 : Nombre d’enfants par famille
Nombre Effectif Eff. cum. Fr ´equence Fr ´eq. cum. ...
d’enfants ni Ni fi Fi
0 4 4 0.08 0.08
1 10 14 0.2 0.28
2 12 26 0.24 0.52
3 8 34 0.16 0.68
4 5 39 0.1 0.78
5 4 43 0.08 0.86
6 4 47 0.08 0.94
7 2 49 0.04 0.98
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
2. Caract `ere quantitatif discret :
0 1 2 3 4 5 6 7 8 0
0.2 0.4 0.6 0.8 1
F(x)
x 0 0 1 2 3 4 5 6 7 8
10 20 30 40 50
G(x)
x
Figure:Courbe cumulative.Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
2. Caract `ere quantitatif discret :
Remarque :
- F(x)repr ´esente la proportion d’individus ayant une modalit ´e inf ´erieure ou ´egale `a x .
- G(x)repr ´esente le nombre d’individus ayant une modalit ´e inf ´erieure ou ´egale `a x .
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
3. Caract `ere quantitatif continu :
a. Histogramme - Polygone des fr ´equences :
Les modalit ´es sont pr ´esent ´ees sous forme de classes [xi;xi+1[, 1≤i ≤k .
Dans l’histogramme, chaque modalit ´e[xi;xi+1[du caract `ere est repr ´esent ´ee par un rectangle dont la base ai est ´egale `a l’amplitude de la classe (ai =xi+1−xi) et dont la hauteur hi est telle que la surface Si =ai×hi du rectangle est
proportionnelle `a l’effectif ni (ou `a la fr ´equence fi) de la classe : Si =Cte×ni
Si =Cte×fi
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
3. Caract `ere quantitatif continu :
Remarque :
On distingue deux cas :
1er cas :Toutes les classes ont une m ˆeme amplitude a.
Dans ce cas, on repr ´esente chaque modalit ´e par un rectangle dont la hauteur est ´egale `a l’effectif (ou `a la fr ´equence) de la modalit ´e. La base de tous les rectangles ´etant la m ˆeme ( ´egale
`a l’amplitude a).
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
3. Caract `ere quantitatif continu :
Exemple :Taille des ´etudiants
Taille Effectif Eff. cum. Fr ´equence Fr ´eq. cum. ...
(en cm) ni Ni fi Fi
[151;155[ 10 10 0.2 0.2
[155;159[ 12 22 0.24 0.44
[159;163[ 11 33 0.22 0.66
[163;167[ 7 40 0.14 0.8
[167;171[ 10 50 0.2 1
Total 50 1
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
3. Caract `ere quantitatif continu :
Histogramme :Toutes les classes ont une m ˆeme amplitude.
5 10 15 Effectif n
i
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
3. Caract `ere quantitatif continu :
Polygone des fr ´equences :
Lorsque toutes les classes ont une m ˆeme amplitude, le polygone des fr ´equences est construit en joignant par des segments de droites les milieux des c ˆot ´es sup ´erieurs des rectangles dans l’histogramme.
Les extr ´emit ´es rejoignent l’axe des abscisses.
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
3. Caract `ere quantitatif continu :
Polygone des fr ´equences :Toutes les classes ont une m ˆeme amplitude a.
5 10 15 Effectif n
i
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
3. Caract `ere quantitatif continu :
2 `eme cas :Les classes n’ont pas toutes la m ˆeme amplitude.
Dans ce cas, on utilise les densit ´es d’effectif die = ni
ai ou les densit ´es de fr ´equence
dif = fi ai
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
3. Caract `ere quantitatif continu :
Les classes n’ont pas toutes la m ˆeme amplitude :
Pour construire l’histogramme, chaque modalit ´e[xi;xi+1[est repr ´esent ´ee par un rectangle dont la base est ´egale `a l’amplitude ai de la classe[xi;xi+1[et dont la hauteur hi est proportionnelle `a la densit ´e d’effectif die(ou `a la densit ´e de fr ´equence dif) correspondante.
hi =C× ni ai
ou f
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
3. Caract `ere quantitatif continu :
C est une constante de proportionnalit ´e.
hi est appel ´ee effectif corrig ´e (ou fr ´equence corrig ´ee) de la modalit ´e[xi;xi+1[.
Le choix de la constante C estarbitraire(on peut prendre C=1 par exemple).
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
Cependant, pour simplifier les calculs et/ou pour tracer le polygone des fr ´equences, il faut choisir C ´egale auplus grand diviseur commundes amplitudes ai.
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
3. Caract `ere quantitatif continu :
Exemple3: Taille des ´etudiants (les classes n’ont pas toutes la m ˆeme amplitude)
Taille ai Effectif Eff. corrig ´e Fr ´eq. Fr ´eq. corrig ´ee ...
(en cm) (en cm) ni hi fi hi
[151;155[ 4 10 10 0.2 0.2
[155;159[ 4 12 12 0.24 0.24
[159;167[ 8 18 9 0.36 0.18
[167;171[ 4 10 10 0.2 0.2
Total 50 1
C=PGDC(ai) =4, (hi =C×nai
i).
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
3. Caract `ere quantitatif continu :
2 `eme cas :Histogramme avec effectif corrig ´e.
5 10
15 Effectif corrigé h i
(C=4)
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
3. Caract `ere quantitatif continu :
151 155 159 163 167 171 0
5 10 15
Taille Effectif n
i
S1
S2
151 155 159 163 167 171 0
5 10
15 Effectif corrigé h i
Taille (C=4)
S1+ S 2
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
3. Caract `ere quantitatif continu :
Polygone des fr ´equences :les classes n’ont pas la m ˆeme amplitude.
Soit C=PGCD(ai).
Toutes les ai sont des multiples de C (ai =ki×C).
Pour construire le polygone des fr ´equences, on partage chaque classe d’amplitude ai =ki×C en ki classes de m ˆeme amplitude C. Puis, on trace les milieux des sommets des rectangles de base C et de hauteur hi et on joint ces milieux par des segments de droites.
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
3. Caract `ere quantitatif continu :
Polygone des fr ´equences :Les classes n’ont pas la m ˆeme amplitude.
151 155 159 163 167 171
0 5 10
15 Effectif corrigé h i
Taille (C=4)
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
3. Caract `ere quantitatif continu :
Histogramme et polygone de fréquencesFréquence corrigée 000.0050.0100.0150.020
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
3. Caract `ere quantitatif continu
b. Courbe cumulative - Fonction de r ´epartition :
La fonction de r ´epartition, not ´ee F(x), est d ´efinie de IR vers [0,1], par :
F(x) =0 si x ≤x1
F(x) =Fi−1+Fi−Fi−1
xi+1−xi(x−xi) si x ∈[xi;xi+1]; 1≤i ≤k
F(x) =1 si x ≥xk+1
avec F0=0 et Fi est la fr ´equence cumul ´ee de la modalit ´e [xi;xi+1[, 1≤i ≤k .
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
3. Caract `ere quantitatif continu
Comme pour le cas discret, la courbe cumulative (ou la courbe des fr ´equences cumul ´ees) est la repr ´esentation graphique de la fonction de r ´epartition F(x).
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
3. Caract `ere quantitatif continu
Remarque
On a la fr ´equence cumul ´ee Fi de la classe[xi;xi+1[est
´egale `a la valeur de F(x)au point xi+1 Fi =F(xi+1)
La courbe cumulative est construite en joignant par des segments de droites les points de coordonn ´ees(xi+1,Fi).
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
3. Caract `ere quantitatif continu
Remarque :
La courbe cumulative est aussi la repr ´esentation graphique des effectifs cumul ´es. On trace alors la fonction, not ´ee G(x), d ´efinie de IR vers[0,N]par :
G(x) =0 si x ≤x1
G(x) =Ni−1+Ni−Ni−1
xi+1−xi (x−xi) si x ∈[xi;xi+1]; 1≤i≤k
G(x) =1 si x ≥xk+1
avec Ni =effectif cumul ´e de la modalit ´e[xi;xi+1[, 1≤i ≤k . N0=0
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
3. Caract `ere quantitatif continu
Exemple3 : Taille des ´etudiants
Taille Effectif Eff. cum. Fr ´equence Fr ´eq. cum. ...
(en cm) ni Ni fi Fi
[151;155[ 10 10 0.2 0.2
[155;159[ 12 22 0.24 0.44
[159;163[ 11 33 0.22 0.66
[163;167[ 7 40 0.14 0.8
[167;171[ 10 50 0.2 1
Total 50 1
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
3. Caract `ere quantitatif continu
0.2 0.4 0.6 0.8 1
Fréquence cumulée (F(x))
10 20 30 40 50
Effectif cumulé (G(x)) N=
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
II.1- Tableaux statistiques II.2- Representations graphiques
3. Caract `ere quantitatif continu
Remarque
La fonction de r ´epartition F(x), d ´efinie pour toute valeur de x, repr ´esente la proportion (ou la fr ´equence) des individus de la population pour lesquels la valeur du caract `ere est inf ´erieure ou ´egale `a x .
La fonction de r ´epartition des effectifs G(x), d ´efinie pour toute valeur de x, repr ´esente le nombre des individus de la population pour lesquels la valeur du caract `ere est inf ´erieure ou ´egale `a x .
F(x)(resp. G(x)) est continue, croissante passant progressivement de 0 `a 1 (resp. de 0 `a N).
F(x) = G(x) N
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
III.4- Param `etres de concentration
III- R ´eduction des donn ´ees
statistiques
I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees
III.1- Param `etres de position III.2- Param `etres de dispersion III.3- Param `etres de forme III.4- Param `etres de concentration
Les tableaux statistiques et les repr ´esentations graphiques donnent une vue globale et d ´etaill ´ee de la distribution d’un caract `ere dans une population.
Le but de la statistique descriptive est aussi de r ´eduire et r ´esumer les donn ´ees d’une distribution `a l’aide des param `etres ou synth ´etiseurs.
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
III.4- Param `etres de concentration
Il existe quatre types de param `etres :
1 Param `etres de position (ou de tendance centrale)
2 Param `etres de dispersion
3 Param `etres de forme
4 Param `etres de concentration
III.1- Param `etres de position III.2- Param `etres de dispersion III.3- Param `etres de forme III.4- Param `etres de concentration
III- R ´eduction des donn ´ees statistiques
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
III.4- Param `etres de concentration 4- G ´en ´eralisation de la notion de moyenne
III.1- Param `etres de position
Appel ´es aussi param `etres de tendance centrale ou de localisation, ils permettent de savoir autour de quelles valeurs se situent les valeurs d’une variable statistique.
III.1- Param `etres de position III.2- Param `etres de dispersion III.3- Param `etres de forme III.4- Param `etres de concentration
1- Le mode 2- La m ´ediane 3- La moyenne
4- G ´en ´eralisation de la notion de moyenne
1- Le mode
D ´efinition
Le mode, not ´e Mo, est la valeur du caract `ere qui admet le plus grand effectif.
C’est la valeur du caract `ere la plus fr ´equente.
Remarque :
Le mode peut ˆetre calcul ´e pour tous les types de caract `ere.
Pour un caract `ere continu, on d ´efinit d’abord la classe modale qui correspond `a l’effectif corrig ´e le plus ´elev ´e.
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
III.4- Param `etres de concentration 4- G ´en ´eralisation de la notion de moyenne
D ´etermination pratique :
a. Cas d’un caract `ere qualitatif :
Le mode correspond `a l’effectif le plus ´elev ´e.
Il correspond au maximum du diagramme en ”tuyaux d’orgue”.
III.1- Param `etres de position III.2- Param `etres de dispersion III.3- Param `etres de forme III.4- Param `etres de concentration
1- Le mode 2- La m ´ediane 3- La moyenne
4- G ´en ´eralisation de la notion de moyenne
Exemple1 :
Etat Effectif M ´ecanique ni
Mauvais 7
Moyen 17
Bon 32
Excellent 14
Total 70
L’effectif le plus ´elev ´e correspond `a la modalit ´e ”Bon”.
Donc, le mode est Mo =Bon.
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
III.4- Param `etres de concentration 4- G ´en ´eralisation de la notion de moyenne
b. Cas d’un caract `ere discret :
Le mode correspond tout simplement `a l’effectif le plus
´elev ´e.
Il correspond au maximum du diagramme en b ˆatons.
III.1- Param `etres de position III.2- Param `etres de dispersion III.3- Param `etres de forme III.4- Param `etres de concentration
1- Le mode 2- La m ´ediane 3- La moyenne
4- G ´en ´eralisation de la notion de moyenne
Exemple2 :
Nombre Effectif d’enfants ni
0 4
1 10
2 12
3 8
4 5
5 4
6 4
7 2
8 1
Total 50
Mo=2
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
III.4- Param `etres de concentration 4- G ´en ´eralisation de la notion de moyenne
c. Cas d’un caract `ere continu :
On d ´efinit d’abord la classe modale qui correspond `a l’effectif corrig ´e le plus ´elev ´e.
La classe modale correspond donc au maximum de l’histogramme.
La classe modale[xi,xi+1[ ´etant d ´etermin ´ee, On d ´etermine la valeur du mode Mo en tenant compte des effectifs corrig ´es des deux classes adjacentes `a la classe modale par la m ´ethode suivante :
III.1- Param `etres de position III.2- Param `etres de dispersion III.3- Param `etres de forme III.4- Param `etres de concentration
1- Le mode 2- La m ´ediane 3- La moyenne
4- G ´en ´eralisation de la notion de moyenne
Effectif corrigé
xi x
i+1
∆1 ∆
2
Mo hi
hi−1 hi+1
Classe modale Histogramme
x
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
III.4- Param `etres de concentration 4- G ´en ´eralisation de la notion de moyenne
On a :
Mo=xi+ (xi+1−xi) ∆1
∆1+ ∆2 avec∆1=hi−hi−1, ∆2=hi−hi+1
III.1- Param `etres de position III.2- Param `etres de dispersion III.3- Param `etres de forme III.4- Param `etres de concentration
1- Le mode 2- La m ´ediane 3- La moyenne
4- G ´en ´eralisation de la notion de moyenne
Exemple3 : Taille des ´etudiants
Taille Effectif (en cm) ni [151;155[ 10 [155;159[ 12 [159;163[ 11 [163;167[ 7 [167;171[ 10
Total 50
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
III.4- Param `etres de concentration 4- G ´en ´eralisation de la notion de moyenne
Dans cet exemple les classes ont toutes la m ˆeme amplitude, on n’a pas besoin d’utiliser les densit ´es. On utilise les effectifs :
La classe modale est :[155,159[.
On a :
∆1=12−10=2
∆2=12−11=1 d’o `u Mo =155+4 2
=157.66 cm
III.1- Param `etres de position III.2- Param `etres de dispersion III.3- Param `etres de forme III.4- Param `etres de concentration
1- Le mode 2- La m ´ediane 3- La moyenne
4- G ´en ´eralisation de la notion de moyenne
Exemple3: Taille des ´etudiants (les classes n’ont pas toutes la m ˆeme amplitude)
Taille Effectif Amplitude Eff. corrig ´e (en cm) ni ai (en cm) hi
[151;155[ 10 4 10
[155;159[ 12 4 12
[159;167[ 18 8 9
[167;171[ 10 4 10
Total 50
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
III.4- Param `etres de concentration 4- G ´en ´eralisation de la notion de moyenne
La classe modale est[155;159[(c’est la classe qui admet la plus grande densit ´e). On a :
∆1=12−10=2
∆2=12−9=3 Donc
Mo =155+4 2 2+3 Le mode de cette distribution est donc :
III.1- Param `etres de position III.2- Param `etres de dispersion III.3- Param `etres de forme III.4- Param `etres de concentration
1- Le mode 2- La m ´ediane 3- La moyenne
4- G ´en ´eralisation de la notion de moyenne
D ´etermination graphique :
151 155 159 163 167 171
0 5 10
15 Effectif corrigé h i
Taille (C=4)
Mo
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
III.4- Param `etres de concentration 4- G ´en ´eralisation de la notion de moyenne
2- La m ´ediane
D ´efinition
La m ´ediane d’un caract `ere ordinal, not ´ee Me, est la valeur centrale de la s ´erie statistique ordonn ´ee.
Cette d ´efinition n’a de sens que si les modalit ´es sont toutes ordonn ´ees par ordre croissant.
III.1- Param `etres de position III.2- Param `etres de dispersion III.3- Param `etres de forme III.4- Param `etres de concentration
1- Le mode 2- La m ´ediane 3- La moyenne
4- G ´en ´eralisation de la notion de moyenne
Remarque
La m ´ediane Mepartage la population en deux sous populations de m ˆeme effectif : 50% de la population ont des modalit ´es≤Meet 50% de la population ont des modalit ´es≥Me.
Me=F−1(12) =G−1(N2)
La m ´ediane peut ˆetre calcul ´ees sur des variables quantitatives et sur des variables qualitatives ordinales.
Module M321 : Probabilit ´e et Statistique pour BCG
A. Fahsi
www.alloacademy.com
III.4- Param `etres de concentration 4- G ´en ´eralisation de la notion de moyenne
D ´etermination pratique : a. Cas d’une variable discr `ete :
Soient x(1),x(2), . . . ,x(n)les valeurs, ordonn ´ee par ordre croissant, d’une s ´erie statistique discr `ete
Si N est impair, la m ´ediane est la valeur centrale de rang N+12 :
Me=x(N+1 2 )
Si N est pair, On prend la moyenne entre les deux valeurs centrales de rang respectifs N2 et N2 +1 :