• Aucun résultat trouvé

Probabilités et statistiques - Cours 3 PDF

N/A
N/A
Protected

Academic year: 2022

Partager "Probabilités et statistiques - Cours 3 PDF"

Copied!
441
0
0

Texte intégral

(1)

STATISTIQUE DESCRIPTIVE

Abdelhak FAHSI

D ´epartement de Mathematiques Facult ´e des Sciences et Techniques Mohammedia

Module M321 : Probabilit ´e et Statistique pour BCG

www.alloacademy.com

(2)
(3)

Les statistiques= Collecte des donn ´ees statistiques (Recensement ou sondage)

La statistique= Traitement des donn ´ees statistiques (m ´ethodes math ´ematiques)

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(4)

chimie, sociologie, m ´edecine, pharmacie, agronomie, industrie, ...

(5)

La statistique comporte deux branches :

La Statistique descriptive : Elle consiste `a r ´esumer, ordonner, pr ´esenter et analyser de fac¸on claire des donn ´ees statistiques relatives `a une population donn ´ee ( ´echantillon) sous forme de tableaux, de graphiques ou de param `etres. (sans tirer de conclusion pour une population plus grande).

La statistique math ´ematique : Elle permet graces aux m ´ethodes math ´ematiques (lois de probabilit ´e) de faire des pr ´evisions et tirer des conclusions sur toute la population `a partir des r ´esultats recueillis sur un

´echantillon.

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(6)

Collecte des donn ´ees (les statistiques) :

recueillir les informations ad ´equates sur un ´echantillon qui serviront de base `a l’ ´etude.

2 Traitement des donn ´ees (la statistique) :

Statistique descriptive : techniques permettant de traiter les donn ´ees recueillies, de les mettre sous forme de tableaux, de graphiques et de d ´egager les

caract ´eristiques essentielles (moyenne, m ´ediane, variance,. . . )

Statistique math ´ematique : techniques permettant de tirer des conclusions sur toute la population `a partir de

(7)

Objectif du cours :

Apprendre les principales techniques de la statistique descriptive `a une dimension et `a deux dimensions.

Etre capable de mettre en oeuvre ces techniques deˆ mani `ere appropri ´ee dans un contexte donn ´e.

Manipuler les techniques de statistiques descriptives au moyen d’un language informatique (language R).

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(8)

1 Statistique descriptive `a une dimension I- Terminologie

II- Organisation des donn ´ees

II.2- Tableaux statistiques II.3- Repr ´esentations graphiques

III- R ´eduction des donn ´ees

III.1- Param `etres de position III.2- Param `etres de dispersion III.3- Param `etres de forme III.4- Param `etres de concentration

2 Statistique descriptive `a deux dimensions I- Tableau de contingence

(9)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

Chapitre 1

Statistique descriptive `a une dimension

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(10)

I- Terminologie

(11)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

1. Population :Ensemble des personnes, objets ou ´el ´ements sur lesquels on veut effectuer l’ ´etude.

2. Individu :Chacun des ´el ´ements de la population (unit ´e statistique).

3. Echantillon : Groupe resreint d’individus pr ´elev ´es dans la population d ´efinie au pr ´ealable.

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(12)

Exemple

On veut ´etudier le poids de 100 enfants ˆag ´es de 1 `a 5 ans.

Population : les enfants ˆag ´es de 1 `a 5 ans.

Individu: chaque enfant ˆag ´e de 1 `a 5 ans.

Echantillon : les 100 enfants ˆag ´es de 1 `a 5 ans.

(13)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

4. Caract `ere (ou variable) :Caract ´eristique relative `a chacun des individus de la population et sur laquelle on veut faire porter l’ ´etude. Il est soit observ ´e soit mesur ´e.

Les caract `eres (ou variables) sont d ´esign ´es par une lettre X , Y ,. . .

Exemple

Le poids des enfants ˆag ´es de 1 `a 5 ans

Le revenu mensuel des salari ´es d’une entreprise La couleur des voitures vendues au Maroc en 2007 La puissance fiscale, etc ...

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(14)

5. S ´erie statistique :C’est une correspondance qui `a chaque individu de la population ´etudi ´ee fait associer une valeur du caract `ere ´etudi ´e.

Les valeurs d’une s ´erie statistique pour un caract `ere X sont not ´ees :

x(1),x(2), . . . ,x(N)

(15)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

Exemple

On consid `ere le caract `ere X =” ´etat civil” de 20 personnes d’une entreprise.

On consid `ere la codification : C=c ´elibataire, M=mari ´e(e), V=veuf(ve), D=divorc ´e(e).

On suppose la s ´erie statistique suivante :

M M D C C M C C C M

c M V M V D C C D M

On a : x(1) =M, x(2)=M, x(3)=D, . . . , x(20)=M,

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(16)

6. Modalit ´es : Ce sont les diff ´erentes valeurs distinctes prises par le caract `ere.

Les modalit ´es d’un caract `ere X sont not ´ees : x1,x2, . . . ,xk

k d ´esigne le nombre de modalit ´es du caract `ere.

Exemple

- le caract `ere ”X =couleur” peut avoir comme modalit ´es : noir, rouge, bleu, blanc, gris, autres.

(17)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

Remarque

Les modalit ´es d’un caract `ere doivent ˆetre :

Incompatibles : (chaque individu a une seule modalit ´e).

Exhaustives(tous les cas sont pr ´evus).

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(18)

On distingue deux types de caract `ere :

Caract `ere qualitatif : C’est un caract `ere non mesurable.

Les modalit ´es ne sont pas des valeurs num ´eriques.

Caract `ere quantitatif : C’est un caract `ere mesurable. Les modalit ´es sont toutes des valeurs num ´eriques.

Pour chaque type de caract `ere, on distingue deux types :

(19)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

Caract `ere qualitatif :

1 Caract `ere qualitatif ordinal : les modalit ´es peuvent ˆetre ordonn ´ees selon une certaine hi ´erarchie.

Exemple

Niveau d’ ´etude: primaire, secondaire, sup ´erieur.

Etat m ´ecanique d’une Voiture: mauvais, moyen, bon, excellent.

2 Caract `ere qualitatif nominal : les modalit ´es ne peuvent pas ˆetre ordonn ´ees: elles sont nomm ´ees mais pas ordonn ´ees.

Exemple

Nationalit ´e: marocaine, allemande, franc¸aise Groupe sanguin: A, B, O, AB

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(20)

Caract `ere quantitatif :

1 Caract `ere quantitatif discret : L’ensemble des valeurs possibles (modalit ´es) est d ´enombrable. On dit aussi variable statistique discr `ete.

Exemple

Nombre d’enfants par famille, nombre d’ ´etudiants par classe, . . .

2 Caract `ere quantitatif continu : L’ensemble des valeurs possibles (modalit ´es) est continu. On dit aussi variable statistique continue.

Exemple

(21)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

Remarque

Lorsque le nombre des modalit ´es d’un caract `ere

quantitatif est ´elev ´e (sup ´erieur `a 15), on est g ´en ´eralement conduit `a regrouper les modalit ´es en classes de la forme

[xi;xi+1[, i=1,2, . . . ,k

Les classes[xi;xi+1[peuvent avoir une m ˆeme amplitude ou des amplitudes diff ´erentes.

Exemple

Le caract `ere ”Revenus mensuels (en dh) des employ ´es d’une entreprise” peut avoir comme modalit ´es :

[4000;5000[,[5000;6000[,[6000;8000[, 8000 et plus.

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(22)

R `egles de construction des classes

Fixer un nombre de classes ni trop petit ni trop grand (g ´en ´eralement de 5 `a 15).

Choisir des bornes qui, autant que possible, permettront des calculs simples (de pr ´ef ´erence, d ´eterminer des classes d’amplitudes ´egales et multiples de 5, 10, 100, 1000).

Consid ´erer des classes adjacentes et, par convention, ferm ´ees `a gauche et ouvertes `a droite.

(23)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

7. Effectif :L’effectif d’une modalit ´e xi, not ´e ni, est le nombre d’individus pr ´esentant cette modalit ´e.

L’effectif total, not ´e N, est le nombre total des individus de la population (appel ´e aussi taille de la population) :

k

X

i=1

ni =N

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(24)

8. Fr ´equence ou proportion : La fr ´equence d’une modalit ´e xi, not ´ee fi, est le rapport fi = ni

N.

C’est la proportion des individus de la population pr ´esentant cette modalit ´e.

Remarque

La fr ´equence fi appartient `a l’intervalle[0,1].

Parfois, on note les fr ´equences en pourcentage (avec le symbole%) en les multipliant par 100.

(25)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

Si le caract `ere est de typeordinal, on peut calculer les effectifs et les fr ´equences cumul ´es.

9. Effectif cumul ´e :L’effectif cumul ´e d’une modalit ´e xi, not ´ee Ni, est le nombre d’individus de la population pour lesquels la valeur du caract `ere est inf ´erieure ou ´egale `a xi :

Ni =

i

X

j=1

nj =Ni−1+ni

On a N1=n1et Nk =N.

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(26)

10. Fr ´equence cumul ´ee :La fr ´equence cumul ´ee d’une modalit ´e xi, not ´ee Fi, est la proportion d’individus pour lesquels la valeur du caract `ere est inf ´erieure ou ´egale `a xi :

Fi = Ni N =

i

X

j=1

fj =Fi−1+fi

(27)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

II- Organisation des donn ´ees

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(28)

II.1- Tableaux statistiques

(29)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

Les tableaux statistiques consistent `a r ´esumer et pr ´esenter les donn ´ees observ ´ees sous la forme num ´erique de distributions d’effectifs et/ou de fr ´equences :

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(30)

Modalit ´es Effectifs Eff Cum Fr ´equences ...

ni Ni fi

x1 n1 N1=n1 f1

... ... ... ... ...

xi ni Ni =Ni−1+ni fi

... ... ... ... ...

xk nk Nk =N fk

Total N 1

(31)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

Exemple1: Dans un atelier de contr ˆole, on a enqu ˆet ´e sur l’ ´etat m ´ecanique d’un ´echantillon al ´eatoire de 70 voitures.

Le contr ˆoleur obtient la s ´erie statistique suivante :

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(32)

Bon Bon Moyen Bon Bon Mauvais

Excellent Moyen Bon Bon Excellent Moyen

Moyen Bon Excellent Mauvais Bon Bon

Bon Mauvais Excellent Bon Bon Excellent

Bon Moyen Mauvais Moyen Excellent Bon

Bon Moyen Excellent Bon Bon Excellent

Mauvais Moyen Excellent Bon Bon Moyen

Bon Excellent Bon Moyen Excellent Bon

Moyen Bon Excellent Bon Mauvais Moyen

Bon Bon Moyen Bon Bon Moyen

Mauvais Excellent Bon Moyen Bon

(33)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

- Population ´etudi ´ee : Echantillon de 70 voitures.

- Caract `ere ´etudi ´e : ´Etat m ´ecanique.

- Modalit ´es : Mauvais, Moyen, Bon, Excellent.

- Type du caract `ere : Qualitatif ordinal.

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(34)

Tableau statistique :

Etat Effectif Eff. cum. Fr ´equence Fr ´eq. cum. ...

M ´ecanique ni Ni fi Fi

Mauvais 7 7 0.1 0.1

Moyen 17 24 0.24 0.34

Bon 32 56 0.46 0.8

Excellent 14 70 0.2 1

Total 70 1

(35)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

Exemple2: Dans un quartier compos ´e de 50 familles, on enqu ˆete sur le nombre d’enfants par famille.

Les valeurs de la variable statistique sont :

1 0 5 2 2 1 2 1 2 4

4 7 1 3 2 5 4 6 3 1

1 6 1 3 8 1 3 5 2 3

3 0 3 4 6 4 1 7 2 0

2 0 1 2 2 3 2 5 6 2

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(36)

- Population ´etudi ´ee : Les 50 familles du quartier.

- Caract `ere ´etudi ´e : nombre d’enfants.

- Modalit ´es : 0, 1, 2, . . . ,8.

- Nature du caract `ere : Quantitatif discret.

(37)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

Tableau statistique :

Nombre Effectif Eff. cum. Fr ´equence Fr ´eq. cum. ...

d’enfants ni Ni fi Fi

0 4 4 0.08 0.08

1 10 14 0.2 0.28

2 12 26 0.24 0.52

3 8 34 0.16 0.68

4 5 39 0.1 0.78

5 4 43 0.08 0.86

6 4 47 0.08 0.94

7 2 49 0.04 0.98

8 1 50 0.02 1

Total 50 1

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(38)

Exemple3: En mesurant la taille de 50 ´etudiants de la FST, on a obtenu les r ´esultats suivants (en cm) :

152 151,5 160 165 170

159 168 161 164 156

158.5 167 157 170,5 161,5

169 156 158,5 160,5 152

156.5 166 152,5 170 165

154 170 165 155.5 166,5

162,5 152,5 168 169 158

157 161 154,5 162 158

153,5 157,5 163 155 153

160 169,5 154 161 162

(39)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

- Population ´etudi ´ee : Echantillon de 50 ´etudiants.

- Caract `ere ´etudi ´e : La taille.

- Modalit ´es :Le nombre des modalit ´es observ ´ees ´etant ´elev ´e, il est donc n ´ecessaire de les grouper en classes.

- Nature du caract `ere : Quantitatif continu.

On peut consid ´erer les classes suivantes : [151;155[

[155;159[

[159;163[

[163;167[

[167;171[

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(40)

Tableau statistique :

Taille Effectif Eff. cum. Fr ´equence Fr ´eq. cum. ...

(en cm) ni Ni fi Fi

[151;155[ 10 10 0.2 0.2

[155;159[ 12 22 0.24 0.44

[159;163[ 11 33 0.22 0.66

[163;167[ 7 40 0.14 0.8

[167;171[ 10 50 0.2 1

Total 50 1

(41)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

II.2- Representations graphiques

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(42)

Bien qu’un tableau statistique r ´esume toute l’information d’une distribution statistique, la repr ´esentation graphique permet de visualiser et de d ´eceler les principales

caract ´eristiques de la distribution statistique (tendance, sym ´etrie, dispersion, concentration, . . . ).

La repr ´esentation graphique des donn ´ees relatives `a un caract `ere repose sur la proportionnalit ´e des longueurs ou des aires aux effectifs (ou aux fr ´equences) des diff ´erentes modalit ´es du caract `ere.

(43)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

Suivant le type du caract `ere ´etudi ´e, on utilise diff ´erents modes de repr ´esentations graphiques.

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(44)

1. Caract `ere qualitatif :

a. Diagramme en tuyaux d’orgue (ou en rectangles) : On repr ´esente chaque modalit ´e par un rectangle dont la hauteur est ´egale `a l’effectif (ou `a la fr ´equence) de la modalit ´e et dont la base est constante

(45)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

1. Caract `ere qualitatif :

Exemple1 : ´etat m ´ecanique de 81 voitures Etat Effectif Fr ´equence M ´ecanique ni fi

Mauvais 7 0.1

Moyen 17 0.24

Bon 32 0.46

Excellent 14 0.2

Total 70 1

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(46)

1. Caract `ere qualitatif :

Voir GraphExcel1

(47)

7

17

32

14

0 5 10 15 20 25 30 35

Mauvais Moyen Bon Excellent

Effectif

A. Fahsi

www.alloacademy.com

(48)

1. Caract `ere qualitatif :

b. Diagramme circulaire ( ou sectoriel) :

Chaque modalit ´e est repr ´esent ´ee par un secteur dont l’angle est proportionnel `a l’effectif correspondant. La totalit ´e de la circonf ´erence (360) correspond `a l’effectif total.

(49)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

1. Caract `ere qualitatif :

Exemple1 : ´etat m ´ecanique de 81 voitures

Etat Effectif Fr ´equence Angle M ´ecanique ni fi αi =360×fi

Mauvais 7 0.1 36

Moyen 17 0.24 87.4

Bon 32 0.46 164.6

Excellent 14 0.2 72

Total 70 1 360

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(50)

1. Caract `ere qualitatif :

Voir GraphExcel2

(51)

Moyen 24%

Mauvais 10%

Excellent 20%

Bon 46%

Diagramme circulaire

A. Fahsi

www.alloacademy.com

(52)

1. Caract `ere qualitatif ordinal

c. Diagramme en rectangles des effectifs cumul ´es : Pour un caract `ere qualitatif ordinal, on peut tracer le diagramme en rectangles des effectifs cumul ´es :

Soit x1<x2< . . . <xk les modalit ´es ordonn ´ees du caract `ere.

On repr ´esente chaque modalit ´e par un rectangle dont la hauteur est ´egale `a l’effectif cumul ´e (ou `a la fr ´equence cumul ´ee) de la modalit ´e et dont la base est constante.

(53)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

1. Caract `ere qualitatif ordinal

Exemple1 : ´etat m ´ecanique de 81 voitures

Etat Effectif Eff. cum. Fr ´equence Fr ´eq. cum.

M ´ecanique ni Ni fi Fi

Mauvais 7 7 0.1 0.1

Moyen 17 24 0.24 0.34

Bon 32 56 0.46 0.8

Excellent 14 70 0.2 1

Total 70 1

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(54)

1. Caract `ere qualitatif ordinal

Voir GraphExcel2

(55)

7

24

56

70

0 10 20 30 40 50 60 70 80

Mauvais Moyen Bon Excellent

Effectif cumulé

A. Fahsi

www.alloacademy.com

(56)

2. Caract `ere quantitatif discret :

a. Diagramme en b ˆatonnets :

Chaque modalit ´e est repr ´esent ´ee par un trait vertical (b ˆatonnet) dont la hauteur est ´egale `a l’effectif (ou `a la fr ´equence) de la modalit ´e.

(57)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

2. Caract `ere quantitatif discret :

Exemple2 : Nombre d’enfants par famille

Nombre Effectif Eff. cum. Fr ´equence Fr ´eq. cum. ...

d’enfants ni Ni fi Fi

0 4 4 0.08 0.08

1 10 14 0.2 0.28

2 12 26 0.24 0.52

3 8 34 0.16 0.68

4 5 39 0.1 0.78

5 4 43 0.08 0.86

6 4 47 0.08 0.94

7 2 49 0.04 0.98

8 1 50 0.02 1

Total 50 1

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(58)

2. Caract `ere quantitatif discret :

5 10 15Effectif n

i

0.1 0.2 0.3 Fréquence f

i

(59)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

2. Caract `ere quantitatif discret :

b. Polygone de fr ´equences :

Le polygone de fr ´equences est construit en joignant par des segments de droites les sommets des b ˆatons du diagramme en b ˆatons.

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(60)

2. Caract `ere quantitatif discret :

5 10 15

ni

(61)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

2. Caract `ere quantitatif discret :

c. Courbe cumulative - Fonction de r ´epartition : Soient x1<x2< . . . <xk les modalit ´es ordonn ´ees du caract `ere.

A partir des fr ´equences cumul ´ees F` i, on d ´efinit la fonction de r ´epartition F(x), d ´efinie de IR vers[0,1], par :

F(x) =0, si x <x1

F(x) =Fi, si xix <xi+1 (1≤ik −1) F(x) =1, si xxk

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(62)

2. Caract `ere quantitatif discret :

La courbe cumulative (ou la courbe des fr ´equences cumul ´ees) est la repr ´esentation graphique de la fonction de r ´epartition F(x).

(63)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

2. Caract `ere quantitatif discret :

Remarque :

La courbe cumulative est aussi la repr ´esentation graphique des effectifs cumul ´es. On trace alors la fonction G(x)d ´efinie de IR vers[0,N]par :

G(x) =0, si x <x1

G(x) =Ni, si xix <xi+1 (1≤ik−1) G(x) =N, si xxk

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(64)

2. Caract `ere quantitatif discret :

Exemple2 : Nombre d’enfants par famille

Nombre Effectif Eff. cum. Fr ´equence Fr ´eq. cum. ...

d’enfants ni Ni fi Fi

0 4 4 0.08 0.08

1 10 14 0.2 0.28

2 12 26 0.24 0.52

3 8 34 0.16 0.68

4 5 39 0.1 0.78

5 4 43 0.08 0.86

6 4 47 0.08 0.94

7 2 49 0.04 0.98

(65)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

2. Caract `ere quantitatif discret :

0 1 2 3 4 5 6 7 8 0

0.2 0.4 0.6 0.8 1

F(x)

x 0 0 1 2 3 4 5 6 7 8

10 20 30 40 50

G(x)

x

Figure:Courbe cumulative.Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(66)

2. Caract `ere quantitatif discret :

Remarque :

- F(x)repr ´esente la proportion d’individus ayant une modalit ´e inf ´erieure ou ´egale `a x .

- G(x)repr ´esente le nombre d’individus ayant une modalit ´e inf ´erieure ou ´egale `a x .

(67)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

3. Caract `ere quantitatif continu :

a. Histogramme - Polygone des fr ´equences :

Les modalit ´es sont pr ´esent ´ees sous forme de classes [xi;xi+1[, 1≤ik .

Dans l’histogramme, chaque modalit ´e[xi;xi+1[du caract `ere est repr ´esent ´ee par un rectangle dont la base ai est ´egale `a l’amplitude de la classe (ai =xi+1xi) et dont la hauteur hi est telle que la surface Si =ai×hi du rectangle est

proportionnelle `a l’effectif ni (ou `a la fr ´equence fi) de la classe : Si =Cte×ni

Si =Cte×fi

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(68)

3. Caract `ere quantitatif continu :

Remarque :

On distingue deux cas :

1er cas :Toutes les classes ont une m ˆeme amplitude a.

Dans ce cas, on repr ´esente chaque modalit ´e par un rectangle dont la hauteur est ´egale `a l’effectif (ou `a la fr ´equence) de la modalit ´e. La base de tous les rectangles ´etant la m ˆeme ( ´egale

`a l’amplitude a).

(69)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

3. Caract `ere quantitatif continu :

Exemple :Taille des ´etudiants

Taille Effectif Eff. cum. Fr ´equence Fr ´eq. cum. ...

(en cm) ni Ni fi Fi

[151;155[ 10 10 0.2 0.2

[155;159[ 12 22 0.24 0.44

[159;163[ 11 33 0.22 0.66

[163;167[ 7 40 0.14 0.8

[167;171[ 10 50 0.2 1

Total 50 1

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(70)

3. Caract `ere quantitatif continu :

Histogramme :Toutes les classes ont une m ˆeme amplitude.

5 10 15 Effectif n

i

(71)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

3. Caract `ere quantitatif continu :

Polygone des fr ´equences :

Lorsque toutes les classes ont une m ˆeme amplitude, le polygone des fr ´equences est construit en joignant par des segments de droites les milieux des c ˆot ´es sup ´erieurs des rectangles dans l’histogramme.

Les extr ´emit ´es rejoignent l’axe des abscisses.

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(72)

3. Caract `ere quantitatif continu :

Polygone des fr ´equences :Toutes les classes ont une m ˆeme amplitude a.

5 10 15 Effectif n

i

(73)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

3. Caract `ere quantitatif continu :

2 `eme cas :Les classes n’ont pas toutes la m ˆeme amplitude.

Dans ce cas, on utilise les densit ´es d’effectif die = ni

ai ou les densit ´es de fr ´equence

dif = fi ai

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(74)

3. Caract `ere quantitatif continu :

Les classes n’ont pas toutes la m ˆeme amplitude :

Pour construire l’histogramme, chaque modalit ´e[xi;xi+1[est repr ´esent ´ee par un rectangle dont la base est ´egale `a l’amplitude ai de la classe[xi;xi+1[et dont la hauteur hi est proportionnelle `a la densit ´e d’effectif die(ou `a la densit ´e de fr ´equence dif) correspondante.

hi =C× ni ai

ou f

(75)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

3. Caract `ere quantitatif continu :

C est une constante de proportionnalit ´e.

hi est appel ´ee effectif corrig ´e (ou fr ´equence corrig ´ee) de la modalit ´e[xi;xi+1[.

Le choix de la constante C estarbitraire(on peut prendre C=1 par exemple).

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(76)

Cependant, pour simplifier les calculs et/ou pour tracer le polygone des fr ´equences, il faut choisir C ´egale auplus grand diviseur commundes amplitudes ai.

(77)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

3. Caract `ere quantitatif continu :

Exemple3: Taille des ´etudiants (les classes n’ont pas toutes la m ˆeme amplitude)

Taille ai Effectif Eff. corrig ´e Fr ´eq. Fr ´eq. corrig ´ee ...

(en cm) (en cm) ni hi fi hi

[151;155[ 4 10 10 0.2 0.2

[155;159[ 4 12 12 0.24 0.24

[159;167[ 8 18 9 0.36 0.18

[167;171[ 4 10 10 0.2 0.2

Total 50 1

C=PGDC(ai) =4, (hi =C×nai

i).

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(78)

3. Caract `ere quantitatif continu :

2 `eme cas :Histogramme avec effectif corrig ´e.

5 10

15 Effectif corrigé h i

(C=4)

(79)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

3. Caract `ere quantitatif continu :

151 155 159 163 167 171 0

5 10 15

Taille Effectif n

i

S1

S2

151 155 159 163 167 171 0

5 10

15 Effectif corrigé h i

Taille (C=4)

S1+ S 2

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(80)

3. Caract `ere quantitatif continu :

Polygone des fr ´equences :les classes n’ont pas la m ˆeme amplitude.

Soit C=PGCD(ai).

Toutes les ai sont des multiples de C (ai =ki×C).

Pour construire le polygone des fr ´equences, on partage chaque classe d’amplitude ai =ki×C en ki classes de m ˆeme amplitude C. Puis, on trace les milieux des sommets des rectangles de base C et de hauteur hi et on joint ces milieux par des segments de droites.

(81)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

3. Caract `ere quantitatif continu :

Polygone des fr ´equences :Les classes n’ont pas la m ˆeme amplitude.

151 155 159 163 167 171

0 5 10

15 Effectif corrigé h i

Taille (C=4)

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(82)

3. Caract `ere quantitatif continu :

Histogramme et polygone de fréquences

Fquence corrigée 000.0050.0100.0150.020

(83)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

3. Caract `ere quantitatif continu

b. Courbe cumulative - Fonction de r ´epartition :

La fonction de r ´epartition, not ´ee F(x), est d ´efinie de IR vers [0,1], par :

F(x) =0 si xx1

F(x) =Fi−1+FiFi−1

xi+1xi(x−xi) si x ∈[xi;xi+1]; 1≤ik

F(x) =1 si xxk+1

avec F0=0 et Fi est la fr ´equence cumul ´ee de la modalit ´e [xi;xi+1[, 1≤ik .

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(84)

3. Caract `ere quantitatif continu

Comme pour le cas discret, la courbe cumulative (ou la courbe des fr ´equences cumul ´ees) est la repr ´esentation graphique de la fonction de r ´epartition F(x).

(85)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

3. Caract `ere quantitatif continu

Remarque

On a la fr ´equence cumul ´ee Fi de la classe[xi;xi+1[est

´egale `a la valeur de F(x)au point xi+1 Fi =F(xi+1)

La courbe cumulative est construite en joignant par des segments de droites les points de coordonn ´ees(xi+1,Fi).

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(86)

3. Caract `ere quantitatif continu

Remarque :

La courbe cumulative est aussi la repr ´esentation graphique des effectifs cumul ´es. On trace alors la fonction, not ´ee G(x), d ´efinie de IR vers[0,N]par :

G(x) =0 si xx1

G(x) =Ni−1+NiNi−1

xi+1xi (x−xi) si x ∈[xi;xi+1]; 1≤ik

G(x) =1 si xxk+1

avec Ni =effectif cumul ´e de la modalit ´e[xi;xi+1[, 1≤ik . N0=0

(87)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

3. Caract `ere quantitatif continu

Exemple3 : Taille des ´etudiants

Taille Effectif Eff. cum. Fr ´equence Fr ´eq. cum. ...

(en cm) ni Ni fi Fi

[151;155[ 10 10 0.2 0.2

[155;159[ 12 22 0.24 0.44

[159;163[ 11 33 0.22 0.66

[163;167[ 7 40 0.14 0.8

[167;171[ 10 50 0.2 1

Total 50 1

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(88)

3. Caract `ere quantitatif continu

0.2 0.4 0.6 0.8 1

Fréquence cumulée (F(x))

10 20 30 40 50

Effectif cumulé (G(x)) N=

(89)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

II.1- Tableaux statistiques II.2- Representations graphiques

3. Caract `ere quantitatif continu

Remarque

La fonction de r ´epartition F(x), d ´efinie pour toute valeur de x, repr ´esente la proportion (ou la fr ´equence) des individus de la population pour lesquels la valeur du caract `ere est inf ´erieure ou ´egale `a x .

La fonction de r ´epartition des effectifs G(x), d ´efinie pour toute valeur de x, repr ´esente le nombre des individus de la population pour lesquels la valeur du caract `ere est inf ´erieure ou ´egale `a x .

F(x)(resp. G(x)) est continue, croissante passant progressivement de 0 `a 1 (resp. de 0 `a N).

F(x) = G(x) N

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(90)

III.4- Param `etres de concentration

III- R ´eduction des donn ´ees

statistiques

(91)

I- Terminologie II- Organisation des donn ´ees III- R ´eduction des donn ´ees

III.1- Param `etres de position III.2- Param `etres de dispersion III.3- Param `etres de forme III.4- Param `etres de concentration

Les tableaux statistiques et les repr ´esentations graphiques donnent une vue globale et d ´etaill ´ee de la distribution d’un caract `ere dans une population.

Le but de la statistique descriptive est aussi de r ´eduire et r ´esumer les donn ´ees d’une distribution `a l’aide des param `etres ou synth ´etiseurs.

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(92)

III.4- Param `etres de concentration

Il existe quatre types de param `etres :

1 Param `etres de position (ou de tendance centrale)

2 Param `etres de dispersion

3 Param `etres de forme

4 Param `etres de concentration

(93)

III.1- Param `etres de position III.2- Param `etres de dispersion III.3- Param `etres de forme III.4- Param `etres de concentration

III- R ´eduction des donn ´ees statistiques

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(94)

III.4- Param `etres de concentration 4- G ´en ´eralisation de la notion de moyenne

III.1- Param `etres de position

Appel ´es aussi param `etres de tendance centrale ou de localisation, ils permettent de savoir autour de quelles valeurs se situent les valeurs d’une variable statistique.

(95)

III.1- Param `etres de position III.2- Param `etres de dispersion III.3- Param `etres de forme III.4- Param `etres de concentration

1- Le mode 2- La m ´ediane 3- La moyenne

4- G ´en ´eralisation de la notion de moyenne

1- Le mode

D ´efinition

Le mode, not ´e Mo, est la valeur du caract `ere qui admet le plus grand effectif.

C’est la valeur du caract `ere la plus fr ´equente.

Remarque :

Le mode peut ˆetre calcul ´e pour tous les types de caract `ere.

Pour un caract `ere continu, on d ´efinit d’abord la classe modale qui correspond `a l’effectif corrig ´e le plus ´elev ´e.

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(96)

III.4- Param `etres de concentration 4- G ´en ´eralisation de la notion de moyenne

D ´etermination pratique :

a. Cas d’un caract `ere qualitatif :

Le mode correspond `a l’effectif le plus ´elev ´e.

Il correspond au maximum du diagramme en ”tuyaux d’orgue”.

(97)

III.1- Param `etres de position III.2- Param `etres de dispersion III.3- Param `etres de forme III.4- Param `etres de concentration

1- Le mode 2- La m ´ediane 3- La moyenne

4- G ´en ´eralisation de la notion de moyenne

Exemple1 :

Etat Effectif M ´ecanique ni

Mauvais 7

Moyen 17

Bon 32

Excellent 14

Total 70

L’effectif le plus ´elev ´e correspond `a la modalit ´e ”Bon”.

Donc, le mode est Mo =Bon.

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(98)

III.4- Param `etres de concentration 4- G ´en ´eralisation de la notion de moyenne

b. Cas d’un caract `ere discret :

Le mode correspond tout simplement `a l’effectif le plus

´elev ´e.

Il correspond au maximum du diagramme en b ˆatons.

(99)

III.1- Param `etres de position III.2- Param `etres de dispersion III.3- Param `etres de forme III.4- Param `etres de concentration

1- Le mode 2- La m ´ediane 3- La moyenne

4- G ´en ´eralisation de la notion de moyenne

Exemple2 :

Nombre Effectif d’enfants ni

0 4

1 10

2 12

3 8

4 5

5 4

6 4

7 2

8 1

Total 50

Mo=2

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(100)

III.4- Param `etres de concentration 4- G ´en ´eralisation de la notion de moyenne

c. Cas d’un caract `ere continu :

On d ´efinit d’abord la classe modale qui correspond `a l’effectif corrig ´e le plus ´elev ´e.

La classe modale correspond donc au maximum de l’histogramme.

La classe modale[xi,xi+1[ ´etant d ´etermin ´ee, On d ´etermine la valeur du mode Mo en tenant compte des effectifs corrig ´es des deux classes adjacentes `a la classe modale par la m ´ethode suivante :

(101)

III.1- Param `etres de position III.2- Param `etres de dispersion III.3- Param `etres de forme III.4- Param `etres de concentration

1- Le mode 2- La m ´ediane 3- La moyenne

4- G ´en ´eralisation de la notion de moyenne

Effectif corrigé

xi x

i+1

1

2

Mo hi

hi−1 hi+1

Classe modale Histogramme

x

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(102)

III.4- Param `etres de concentration 4- G ´en ´eralisation de la notion de moyenne

On a :

Mo=xi+ (xi+1xi) ∆1

1+ ∆2 avec∆1=hihi−1, ∆2=hihi+1

(103)

III.1- Param `etres de position III.2- Param `etres de dispersion III.3- Param `etres de forme III.4- Param `etres de concentration

1- Le mode 2- La m ´ediane 3- La moyenne

4- G ´en ´eralisation de la notion de moyenne

Exemple3 : Taille des ´etudiants

Taille Effectif (en cm) ni [151;155[ 10 [155;159[ 12 [159;163[ 11 [163;167[ 7 [167;171[ 10

Total 50

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(104)

III.4- Param `etres de concentration 4- G ´en ´eralisation de la notion de moyenne

Dans cet exemple les classes ont toutes la m ˆeme amplitude, on n’a pas besoin d’utiliser les densit ´es. On utilise les effectifs :

La classe modale est :[155,159[.

On a :

1=12−10=2

2=12−11=1 d’o `u Mo =155+4 2

=157.66 cm

(105)

III.1- Param `etres de position III.2- Param `etres de dispersion III.3- Param `etres de forme III.4- Param `etres de concentration

1- Le mode 2- La m ´ediane 3- La moyenne

4- G ´en ´eralisation de la notion de moyenne

Exemple3: Taille des ´etudiants (les classes n’ont pas toutes la m ˆeme amplitude)

Taille Effectif Amplitude Eff. corrig ´e (en cm) ni ai (en cm) hi

[151;155[ 10 4 10

[155;159[ 12 4 12

[159;167[ 18 8 9

[167;171[ 10 4 10

Total 50

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(106)

III.4- Param `etres de concentration 4- G ´en ´eralisation de la notion de moyenne

La classe modale est[155;159[(c’est la classe qui admet la plus grande densit ´e). On a :

1=12−10=2

2=12−9=3 Donc

Mo =155+4 2 2+3 Le mode de cette distribution est donc :

(107)

III.1- Param `etres de position III.2- Param `etres de dispersion III.3- Param `etres de forme III.4- Param `etres de concentration

1- Le mode 2- La m ´ediane 3- La moyenne

4- G ´en ´eralisation de la notion de moyenne

D ´etermination graphique :

151 155 159 163 167 171

0 5 10

15 Effectif corrigé h i

Taille (C=4)

Mo

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(108)

III.4- Param `etres de concentration 4- G ´en ´eralisation de la notion de moyenne

2- La m ´ediane

D ´efinition

La m ´ediane d’un caract `ere ordinal, not ´ee Me, est la valeur centrale de la s ´erie statistique ordonn ´ee.

Cette d ´efinition n’a de sens que si les modalit ´es sont toutes ordonn ´ees par ordre croissant.

(109)

III.1- Param `etres de position III.2- Param `etres de dispersion III.3- Param `etres de forme III.4- Param `etres de concentration

1- Le mode 2- La m ´ediane 3- La moyenne

4- G ´en ´eralisation de la notion de moyenne

Remarque

La m ´ediane Mepartage la population en deux sous populations de m ˆeme effectif : 50% de la population ont des modalit ´es≤Meet 50% de la population ont des modalit ´es≥Me.

Me=F−1(12) =G−1(N2)

La m ´ediane peut ˆetre calcul ´ees sur des variables quantitatives et sur des variables qualitatives ordinales.

Module M321 : Probabilit ´e et Statistique pour BCG

A. Fahsi

www.alloacademy.com

(110)

III.4- Param `etres de concentration 4- G ´en ´eralisation de la notion de moyenne

D ´etermination pratique : a. Cas d’une variable discr `ete :

Soient x(1),x(2), . . . ,x(n)les valeurs, ordonn ´ee par ordre croissant, d’une s ´erie statistique discr `ete

Si N est impair, la m ´ediane est la valeur centrale de rang N+12 :

Me=x(N+1 2 )

Si N est pair, On prend la moyenne entre les deux valeurs centrales de rang respectifs N2 et N2 +1 :

Références

Documents relatifs

Dans plusieurs copies, il a été dit, avec raison, que malgré la gravité de la crise actuelle et même si les tentations de retour au protectionnisme sont fortes, il n’y a pas eu

[r]

Chaque joueur lance le dé à tour de rôle et avance du nombre de cases indiqué en respectant les consignes des cases « Jack » et des cases « ogre ». Celui qui totalise le plus de

[r]

La veille des ´ elections pr´ esidentielles on effectue un sondage aupr` es de n personnes, afin d’estimer la proportion p de personnes dans la population totale qui ont l’intention

[r]

la seconde : ´ecart de 1 note la tierce : ´ecart de 2 notes la quarte : ´ecart de 3 notes la quinte : ´ecart de 4 notes la sixte : ´ecart de 5 notes la septieme : ´ecart de 6 notes..

Dans le cas d'une notation de 0 à 20, l'écart type minimal est 0 (notes toutes identiques), et peut valoir jusqu'à 10 si la moitié de la classe a 0/20 et l'autre moitié 20/20..