• Aucun résultat trouvé

1. Introduction et définitions

N/A
N/A
Protected

Academic year: 2022

Partager "1. Introduction et définitions"

Copied!
192
0
0

Texte intégral

(1)

La statistique descriptive

(2)

1. Introduction et définitions

Statistique descriptive:

Analyse et synthèse, NUMERIQUE et GRAPHIQUE, d’un ensemble de données

(3)

1. Introduction et définitions

Statistique descriptive:

Analyse et synthèse, NUMERIQUE et GRAPHIQUE, d’un ensemble de données

But: Synthétiser l’information contenue dans les données Origine: étude démographique

(4)

Individus: latin: « ce qui est indivisible »

stat: chacune des « personnes » étudiées

(5)

Individus: latin: « ce qui est indivisible »

stat: chacune des « personnes » étudiées

Personne humaine, automobile, entreprise, pays, ….

(6)

Individus: latin: « ce qui est indivisible »

stat: chacune des « personnes » étudiées

Personne humaine, automobile, entreprise, pays, ….

Population: ensemble des individus observés

(7)

Individus: latin: « ce qui est indivisible »

stat: chacune des « personnes » étudiées

Personne humaine, automobile, entreprise, pays, ….

Population: ensemble des individus observés

Les étudiants de 12-25ans, les Renault produites entre 1990 et 1995

(8)

Individus: latin: « ce qui est indivisible »

stat: chacune des « personnes » étudiées

Personne humaine, automobile, entreprise, pays, ….

Population: ensemble des individus observés

Les étudiants de 12-25ans, les Renault produites entre 1990 et 1995

Caractère (Variable Statistique): ce qu’on observe sur

chacun des individus de la population

(9)

Individus: latin: « ce qui est indivisible »

stat: chacune des « personnes » étudiées

Personne humaine, automobile, entreprise, pays, ….

Population: ensemble des individus observés

Les étudiants de 12-25ans, les Renault produites entre 1990 et 1995

Sexe, age, taille, nombre enfants,…

Caractère (Variable Statistique): ce qu’on observe sur

chacun des individus de la population

(10)

Attention:

La population doit être définie avec précision, c’est totalement différent de considérer:

•Les étudiants

•Les étudiants de 12-25 ans

•Les étudiants de l’IUP com. et vente de Grenoble

(11)

Attention:

La population doit être définie avec précision, c’est totalement différent de considérer:

•Les étudiants

•Les étudiants de 12-25 ans

•Les étudiants de l’IUP com. et vente de Grenoble

La population doit être homogène au regard des caractères étudiés:

la répartition des individus selon leur taille doit

distinguer les deux sexes

(12)

Qualitatifs: non mesurables

(13)

Qualitatifs: non mesurables

Sexe, couleur des yeux, secteur

d’activité

(14)

Qualitatifs: non mesurables Quantitatifs: mesurables

Sexe, couleur des yeux, secteur

d’activité

(15)

Qualitatifs: non mesurables

Age, taille , PIB, taux de chômage

Quantitatifs: mesurables

Sexe, couleur des yeux, secteur

d’activité

(16)

Quantitatifs discrets:

peuvent prendre un nombre fini et faible de valeurs

Qualitatifs: non mesurables

Age, taille , PIB, taux de chômage

Quantitatifs: mesurables

Sexe, couleur des yeux, secteur

d’activité

(17)

Quantitatifs discrets:

peuvent prendre un nombre fini et faible de valeurs

Qualitatifs: non mesurables

Age, taille , PIB, taux de chômage

Quantitatifs: mesurables

Sexe, couleur des yeux, secteur

d’activité

Nb enfants 0 1 2 3 4 5

(18)

Quantitatifs discrets:

peuvent prendre un nombre fini et faible de valeurs

Qualitatifs: non mesurables

Age, taille , PIB, taux de chômage

Quantitatifs: mesurables

Sexe, couleur des yeux, secteur

d’activité

Quantitatifs continues:

•Par nature:

Nb enfants 0 1 2 3 4 5

(19)

Quantitatifs discrets:

peuvent prendre un nombre fini et faible de valeurs

Qualitatifs: non mesurables

Age, taille , PIB, taux de chômage

Quantitatifs: mesurables

Sexe, couleur des yeux, secteur

d’activité

Quantitatifs continues:

•Par nature:

Nb enfants 0 1 2 3 4 5 Taille:

1m 2m

(20)

Quantitatifs discrets:

peuvent prendre un nombre fini et faible de valeurs

Qualitatifs: non mesurables

Age, taille , PIB, taux de chômage

Quantitatifs: mesurables

Sexe, couleur des yeux, secteur

d’activité

Quantitatifs continues:

•Par nature:

Nb enfants 0 1 2 3 4 5 Taille:

1m 2m

•Par nécessité:

(21)

Quantitatifs discrets:

peuvent prendre un nombre fini et faible de valeurs

Qualitatifs: non mesurables

Age, taille , PIB, taux de chômage

Quantitatifs: mesurables

Sexe, couleur des yeux, secteur

d’activité

Quantitatifs continues:

•Par nature:

Nb enfants 0 1 2 3 4 5 Taille:

1m 2m

•Par nécessité:

Nombre de salariés d’une PME 0 500

(22)

2. Étude d’un caractère qualitatif

2.1 Modalités d’un caractère: les différents états d’un caractère qualitatif.

EXHAUSTIFS et INCOMPATIBLES

(23)

2. Étude d’un caractère qualitatif

2.1 Modalités d’un caractère: les différents états d’un caractère qualitatif.

EXHAUSTIFS et INCOMPATIBLES

Cad chaque individu présente une et une seule modalité du caractère

(24)

2. Étude d’un caractère qualitatif

2.1 Modalités d’un caractère: les différents états d’un caractère qualitatif.

EXHAUSTIFS et INCOMPATIBLES

Cad chaque individu présente une et une seule modalité du caractère

Cadre supérieure, Profession int., Employé, Ouvrier, Ouvrier qualifié

(25)

2. Étude d’un caractère qualitatif

2.1 Modalités d’un caractère: les différents états d’un caractère qualitatif.

EXHAUSTIFS et INCOMPATIBLES

Cad chaque individu présente une et une seule modalité du caractère

Cadre supérieure, Profession int., Employé, Ouvrier, Ouvrier qualifié Inactifs

(26)

2. Étude d’un caractère qualitatif

2.1 Modalités d’un caractère: les différents états d’un caractère qualitatif.

EXHAUSTIFS et INCOMPATIBLES

Cad chaque individu présente une et une seule modalité du caractère

Cadre supérieure, Profession int., Employé, Ouvrier, Ouvrier qualifié Inactifs

(27)

2.2 Pourcentage et fréquence:

p

i

f

i

N= Effectif total de la population

Effectif de la modalité considérée

n

i

=

N 100

p

i

= n

i

f

i

= n N

i

(28)

2.2 Pourcentage et fréquence:

p

i

f

i

N= Effectif total de la population

Effectif de la modalité considérée

n

i

=

N 100

p

i

= n

i

f

i

= n N

i

Propriété:

∑ = 100

i

p

i

= 1

i

f

i

(29)

2.2 Pourcentage et fréquence:

p

i

f

i

N= Effectif total de la population

Effectif de la modalité considérée

n

i

=

N 100

p

i

= n

i

f

i

= n N

i

Propriété:

∑ = 100

i

p

i

= 1

i

f

i

Exemple: En 1989 parmi les français de plus de 15 ans Sur 21033906 hommes il y a 4286858 retraités

des hommes sont retraités

% 20 21033906 100

4286858 ≈

(30)

2.3 Tableau de distribution:

100 43997993

Ensemble

26.7 11741884

Inactifs divers (autres que retraités)

19.2 8429509

Retraités

16.2 7121812

Ouvriers

15.4 6771239

Employés

10.4 4593294

Professions intermédiaires

5.3 2314770

Cadres et professions intellectuelles supérieures

4.0 1757221

Artisans, commerçants et chefs d’entreprises

2.9 1268264

Agriculteurs exploitants

Pourcentages Nb de personnes

CSP

Français de plus de 15 ans en 1986

(31)

2.4 Représentations graphiques:

Règle: sur les graphiques, les aires des modalités

sont proportionnelles à leurs effectifs

(32)

2.4 Représentations graphiques:

Règle: sur les graphiques, les aires des modalités sont proportionnelles à leurs effectifs

0 10 20 30

Pourcentages

Agri. Exploi.

Artisans, … Cadres … Prof. Int.

Employés Ouvriers Retraités Inactifs

a. Diagramme en barre:

La hauteur des barres est

proportionnelle à l’effectif de la modalité

(33)

b. Diagramme en secteurs:

L’angle du secteur de disque est proportionnel à l’effectif de la modalité

Agri. Exploi.

Artisans, … Cadres … Prof. Int.

Employés Ouvriers Retraités Inactifs

(34)

3. Étude d’une variable quantitative discrète

Ménage Français par rapport à leur effectif en 1989

100 22434621

Total

1.8 109189

6 ou plus

5.3 1182235

5 personnes

13.6 3057674

4 personnes

16.1 3619655

3 personnes

31.6 7086664

2 personnes

31.6 7079434

1 personne

Pourcentage Effectif

Nbe personnes

(35)

3. Étude d’une variable quantitative discrète

Ménage Français par rapport à leur effectif en 1989

100 22434621

Total

1.8 109189

6 ou plus

5.3 1182235

5 personnes

13.6 3057674

4 personnes

16.1 3619655

3 personnes

31.6 7086664

2 personnes

31.6 7079434

1 personne

Pourcentage Effectif

Nbe personnes

On considère 6 et +

comme valant 6

(36)

3.1 Fréquence cumulée: proportion d’individus dont la valeur du caractère est inférieure ou égale à la valeur considérée

100 22434621

Total

2 109189

6 ou plus

5 1182235

5 pers.

14 3057674

4 pers.

16 3619655

3 pers.

32 7086664

2 pers.

32 7079434

1 pers.

Pi Effectif

Nbe pers.

32

F. Cumulée en %

(37)

3.1 Fréquence cumulée: proportion d’individus dont la valeur du caractère est inférieure ou égale à la valeur considérée

100 22434621

Total

2 109189

6 ou plus

5 1182235

5 pers.

14 3057674

4 pers.

16 3619655

3 pers.

32 7086664

2 pers.

32 7079434

1 pers.

Pi Effectif

Nbe pers.

32

F. Cumulée en %

22434621

7086664 7079434 +

63

64 32

32 + =

(38)

3.1 Fréquence cumulée: proportion d’individus dont la valeur du caractère est inférieure ou égale à la valeur considérée

100 22434621

Total

2 109189

6 ou plus

5 1182235

5 pers.

14 3057674

4 pers.

16 3619655

3 pers.

32 7086664

2 pers.

32 7079434

1 pers.

Pi Effectif

Nbe pers.

32

F. Cumulée en %

22434621

7086664 7079434 +

63

64 32

32 + =

En 1989, 63% des ménages sont composés de 2 personnes ou moins

100 98 93 79

(39)

3.2 Représentations graphiques:

a. Histogramme des fréquences:

Diagramme en bâton: en abscisse les valeurs du caractère en ordonnée les fréquences

0 10 20 30

1 2 3 4 5 6 et +

Nbe de pers.

par ménage Fréquence en %

(40)

3.2 Représentations graphiques:

a. Histogramme des fréquences:

Diagramme en bâton: en abscisse les valeurs du caractère en ordonnée les fréquences

0 10 20 30

1 2 3 4 5 6 et +

Nbe de pers.

par ménage Fréquence en %

32% des ménages sont composés de

2 personnes

(41)

b. Diagramme cumulatif:

Représente les fréquences cumulées en fonction des valeurs du caractère

0 25 50 75 100

0 1 2 3 4 5 6 7

Nbe pers.

par ménage Fréquence en %

(42)

b. Diagramme cumulatif:

Représente les fréquences cumulées en fonction des valeurs du caractère

79% des ménages français sont constitué de

strictement moins de 4 personnes

0 25 50 75 100

0 1 2 3 4 5 6 7

Nbe pers.

par ménage Fréquence en %

(43)

3.3 Résumé numérique d’une distribution:

a. Caractéristiques centrales:

La moyenne notée x

Moyenne arithmétique des valeurs du caractère pour les n individus de la population

=

=

i i i

i

n

i

x

i

f x

x 1 n

(44)

3.3 Résumé numérique d’une distribution:

a. Caractéristiques centrales:

La moyenne notée x

Moyenne arithmétique des valeurs du caractère pour les n individus de la population

=

=

i i i

i

n

i

x

i

f x

x 1 n

Représente le barycentre des valeurs prises par le

caractère

(45)

100 22434621

Total

2 109189

6 ou plus

5 1182235

5 pers.

14 3057674

4 pers.

16 3619655

3 pers.

32 7086664

2 pers.

32 7079434

1 pers.

Pi Effectif

Nbe pers.

=

=

i i i

i

n

i

x

i

f x

x 1 n

0.32*1 +0.32*2 +0.16*3 +0.14*4 +0.05*5 +0.02*6

) (personnes 4

.

≈ 2

=

x

(46)

100 22434621

Total

2 109189

6 ou plus

5 1182235

5 pers.

14 3057674

4 pers.

16 3619655

3 pers.

32 7086664

2 pers.

32 7079434

1 pers.

Pi Effectif

Nbe pers.

=

=

i i i

i

n

i

x

i

f x

x 1 n

0.32*1 +0.32*2 +0.16*3 +0.14*4 +0.05*5 +0.02*6

) (personnes 4

.

≈ 2

= x

Ne pas oublier l’unité

En 1989 en France, il y a en

moyenne 2.4 personnes par ménage

(47)

Le(s) mode(s)

Valeurs du caractère en lesquelles l’histogramme des

fréquences possède un maximum relatif

(48)

Le(s) mode(s)

Valeurs du caractère en lesquelles l’histogramme des fréquences possède un maximum relatif

0 10 20 30

1 2 3 4 5 6 et +

Nbe de pers.

par ménage Fréquence en %

Le mode vaut: 2 personnes

(49)

Valeurs du caractère en lesquels l’histogramme des fréquences possède un maximum RELATIF

Le mode

(50)

Valeurs du caractère en lesquels l’histogramme des fréquences possède un maximum RELATIF

Le mode

Cette distribution a 2 modes!

Elle est BIMODALE

C’est souvent caractéristique d’une population

NON HOMOGENE

(51)

La médiane

Valeur du caractère qui partage la série statistique en 2 groupes de même fréquence (0.5).

On la détermine à l’aide des fréquences cumulées ou

du diagramme cumulatif

(52)

La médiane

Valeur du caractère qui partage la série statistique en 2 groupes de même fréquence (0.5).

On la détermine à l’aide des fréquences cumulées ou du diagramme cumulatif

La médiane est entre 1 et 2

personnes par ménage

0 25 50 75 100

0 1 2 3 4 5 6 7

Nbe pers.

par ménage Fréquence en %

(53)

La médiane

Valeur du caractère qui partage la série statistique en 2 groupes de même fréquence (0.5).

On la détermine à l’aide des fréquences cumulées ou du diagramme cumulatif

32% 1 pers. ou moins

62% 2 pers. ou moins

La médiane est entre 1 et 2

personnes par ménage

0 25 50 75 100

0 1 2 3 4 5 6 7

Nbe pers.

par ménage Fréquence en %

(54)

Quelle est la différence entre moyenne et médiane?

Note de préparation à la maison semaine3:

6 14 16

médiane

= 12

x

(55)

Quelle est la différence entre moyenne et médiane?

Note de préparation à la maison semaine3:

6 14 16

médiane

= 12 x

3

x = 9

La médiane est peu sensible aux valeurs aberrantes contrairement à la moyenne

(56)

b. Caractéristiques de dispersion:

Exemple:

Notes des devoirs à la maison en 2001 à l’IUP com et vente

•Semaine 1: 9, 10, 10, 11

•Semaine 2: 0, 10, 10, 20

(57)

b. Caractéristiques de dispersion:

Exemple:

Notes des devoirs à la maison en 2001 à l’IUP com et vente

•Semaine 1: 9, 10, 10, 11

•Semaine 2: 0, 10, 10, 20

Toutes les caractéristiques centrales valent 10!

(58)

b. Caractéristiques de dispersion:

Exemple:

Notes des devoirs à la maison en 2001 à l’IUP com et vente

•Semaine 1: 9, 10, 10, 11

•Semaine 2: 0, 10, 10, 20

Toutes les caractéristiques centrales valent 10!

Trouver des valeurs numériques qui caractérisent la dispersion de la distribution

Comment les valeurs sont elles éloignées de la moyenne?

(59)

Une mauvaise idée: ∑

i i i

x

n n ( x )

1

•Semaine 1: 9, 10, 10, 11

( 1 * ( 9 10 ) 2 * ( 10 10 ) 1 * ( 11 10 ) ) 0

4

1 − + − + − =

(60)

Une mauvaise idée: ∑

i i i

x

n n ( x )

1

•Semaine 1: 9, 10, 10, 11

( 1 * ( 9 10 ) 2 * ( 10 10 ) 1 * ( 11 10 ) ) 0

4

1 − + − + − =

+

=

0

Les écarts positifs et négatifs se compensent!

(61)

L’écart absolu moyen:

La moyenne des ECARTS ABSOLUS à la moyenne

x n n x x f x

e

i

i i

i i i

x

= 1 ∑ − = ∑ −

(62)

100 22434621

Total

2 109189

6 ou plus

5 1182235

5 pers.

14 3057674

4 pers.

16 3619655

3 pers.

32 7086664

2 pers.

32 7079434

1 pers.

Pi Effectif

Nb pers.

0.32 * |1-2.4|

+ 0.32 * |2-2.4|

+ 0.16 * |3-2.4|

+ 0.14 * |4-2.4|

+ 0.05 * |5-2.4|

+ 0.02 * |6-2.4|

) (personnes 4

.

≈ 1

e

x

L’écart absolu moyen:

) (personnes 4

.

= 2

x

(63)

100 22434621

Total

2 109189

6 ou plus

5 1182235

5 pers.

14 3057674

4 pers.

16 3619655

3 pers.

32 7086664

2 pers.

32 7079434

1 pers.

Pi Effectif

Nb pers.

0.32 * |1-2.4|

+ 0.32 * |2-2.4|

+ 0.16 * |3-2.4|

+ 0.14 * |4-2.4|

+ 0.05 * |5-2.4|

+ 0.02 * |6-2.4|

) (personnes 4

.

≈ 1

e

x

L’écart absolu moyen:

) (personnes 4

.

= 2 x

Attention à l’unité

(64)

La variance et l’écart-type:

La variance est la moyenne des carrés des écarts à la moyenne

( ) x x f ( ) x x

n i i

n

i i

=

i i

=

2 2

2

1

σ

(65)

La variance et l’écart-type:

La variance est la moyenne des carrés des écarts à la moyenne

( ) x x f ( ) x x

n i i

n

i i

=

i i

=

2 2

2

1

σ

Si x a pour unité la personne, alors a pour unité

σ

2

personne

2

(66)

La variance et l’écart-type:

La variance est la moyenne des carrés des écarts à la moyenne

( ) x x f ( ) x x

n i i

n

i i

=

i i

=

2 2

2

1

σ

Si x a pour unité la personne, alors a pour unité

σ

2

personne

2

L’écart-type est la racine carré de la variance

σ

σ =

2

(67)

La variance et l’écart-type:

La variance est la moyenne des carrés des écarts à la moyenne

( ) x x f ( ) x x

n i i

n

i i

=

i i

=

2 2

2

1

σ

Si x a pour unité la personne, alors a pour unité

σ

2

personne

2

L’écart-type est la racine carré de la variance

σ

σ =

2

Même unité que le caractère

(68)

La variance et l’écart-type:

La variance est la moyenne des carrés des écarts à la moyenne

( ) x x f ( ) x x

n i i

n

i i

=

i i

=

2 2

2

1

σ

Si x a pour unité la personne, alors a pour unité

σ

2

personne

2

L’écart-type est la racine carré de la variance

σ

σ =

2

Même unité que le caractère

Entre et il y a au moins 75% de la population x2 σ x + 2 σ

(69)

Pour calculer la variance on peut utiliser la formule:

x x f

i i i

2 2

2

 −

 

=  ∑

σ

) (personnes 4

.

= 2 x

100 22434621

Total

2 109189

6 ou plus

5 1182235

5 pers.

14 3057674

4 pers.

16 3619655

3 pers.

32 7086664

2 pers.

32 7079434

1 pers.

Pi Effectif

Nbe pers.

0.32 * 1

2

+ 0.32 * 2

2

+ 0.16 * 3

2

+ 0.14 * 4

2

+ 0.05 * 5

2

+ 0.02 * 6

2

) (

1.5 25

.

7

2 4

2

personnes

2

2-

.

σ

(70)

Pour calculer la variance on peut utiliser la formule:

x x f

i i i

2 2

2

 −

 

=  ∑

σ

) (personnes 4

.

= 2 x

100 22434621

Total

2 109189

6 ou plus

5 1182235

5 pers.

14 3057674

4 pers.

16 3619655

3 pers.

32 7086664

2 pers.

32 7079434

1 pers.

Pi Effectif

Nbe pers.

0.32 * 1

2

+ 0.32 * 2

2

+ 0.16 * 3

2

+ 0.14 * 4

2

+ 0.05 * 5

2

+ 0.02 * 6

2

) (

1.5 25

.

7

2 4

2

personnes

2

2-

.

σ

Attention à l’unité

(71)

En 1999, au moins 75% des ménages français ont un effectif entre 0 et 4.8 personnes.

(personne) 2

. 1 5

.

1 ≈

σ ≈

(72)

4. Étude d’une variable quantitative continue

Même notion que dans le chapitre précédent.

La seule différence est que on ne considère pas les

modalité une par une mais par CLASSES

(73)

4. Étude d’une variable quantitative continue

Même notion que dans le chapitre précédent.

La seule différence est que on ne considère pas les modalité une par une mais par CLASSES

Intervalle de valeurs possibles pour la variable statistique continue

(74)

Population française active par âge en 1999

100 100

26542481 Total

100 8.4

2225411 55 et +

91.6 12.5

3305278 50-54

79.2 13.9

3696642 45-49

65.2 14.2

3770300 40-44

51.0 14.6

3865252 35-39

36.5 14.2

3771554 30-34

22.3 13.7

3628502 25-29

8.6 8.6

2279542 15-24

Cumul Pourcentage

Effectif

Age

(75)

Population française active par âge en 1999

100 100

26542481 Total

100 8.4

2225411 55 et +

91.6 12.5

3305278 50-54

79.2 13.9

3696642 45-49

65.2 14.2

3770300 40-44

51.0 14.6

3865252 35-39

36.5 14.2

3771554 30-34

22.3 13.7

3628502 25-29

8.6 8.6

2279542 15-24

Cumul Pourcentage

Effectif Age

Il y a 3771554 personnes

dans la classe d’âge des 30-34 ans

(76)

Comment déterminer les classes?

(77)

Comment déterminer les classes?

•Nombre de classes relativement faible: ≤ 10

(78)

Comment déterminer les classes?

•Nombre de classes relativement faible: ≤ 10

•Effectif des classes du même ordre de grandeur

Classe fine là où le caractère est plus fréquent Classe large là où le caractère est rare

(79)

Comment déterminer les classes?

•Nombre de classes relativement faible: ≤ 10

•Effectif des classes du même ordre de grandeur

Classe fine là où le caractère est plus fréquent Classe large là où le caractère est rare

•Essayer d’utiliser des classes de même amplitude

(80)

Comment déterminer les classes?

•Nombre de classes relativement faible: ≤ 10

•Effectif des classes du même ordre de grandeur

Classe fine là où le caractère est plus fréquent Classe large là où le caractère est rare

•Essayer d’utiliser des classes de même amplitude

Souvent la première et la dernière classe n’ont pas la

même amplitude

(81)

4.1 Fréquence relative

Quand les amplitudes des classes sont différentes on ne considère plus les fréquences, mais les

FREQUENCES RELATIVES:

a f

i i

est l’amplitude de la classe

a

i

(82)

100 1

26542481 Total

100 0.084

2225411 55 et +

91.6 0.125

3305278 50-54

79.2 0.139

3696642 45-49

65.2 0.142

3770300 40-44

51.0 0.146

3865252 35-39

36.5 0.142

3771554 30-34

22.3 0.137

3628502 25-29

8.6 0.086

2279542 15-24

Cumul .fi

Effectif Age

1 1 1 1 1 1 2 .ai

2 0.042

0.125 0.139 0.142 0.146 0.142 0.137 0.043

.f relative à 5 ans

(83)

100 1

26542481 Total

100 0.084

2225411 55 et +

91.6 0.125

3305278 50-54

79.2 0.139

3696642 45-49

65.2 0.142

3770300 40-44

51.0 0.146

3865252 35-39

36.5 0.142

3771554 30-34

22.3 0.137

3628502 25-29

8.6 0.086

2279542 15-24

Cumul .fi

Effectif Age

1 1 1 1 1 1 2 .ai

Pour avoir la largeur de classe il faut fixer la borne supérieur de la classe.

Il faut prendre une décision raisonnable.

Ici on parle de population active: 55-64

2 0.042

0.125 0.139 0.142 0.146 0.142 0.137 0.043

.f relative à 5 ans

(84)

4.2 Représentations graphiques:

a. Histogramme des fréquences:

Les classes de la distribution forment les bases des batons Les SURFACES sont proportionnelles aux fréquences!

(85)

4.2 Représentations graphiques:

a. Histogramme des fréquences:

Les classes de la distribution forment les bases des batons Les SURFACES sont proportionnelles aux fréquences!

Donc si les classes sont d’amplitudes différentes, les

HAUTEURS des histogrammes sont proportionnelles

aux FREQUENCES RELATIVES.

(86)

0 2 4 6 8 10 12 14 16

0 10 20 30 40 50 60

Age en années .f relatives

à 5 ans

(87)

0 2 4 6 8 10 12 14 16

0 10 20 30 40 50 60

Age en années .f relatives

à 5 ans

Pour la borne supérieure on conserve toujours la même

(88)

b. Polygone des fréquences cumulées:

En abscisse les limites de classes

En ordonnée les fréquence cumulées

On rejoint les points par une ligne brisée

0 20 40 60 80 100

0 10 20 30 40 50 60

Age en années .f cumulées

(89)

4.3 Résumé numérique d’une distribution:

a. Caractéristiques centrales:

La moyenne notée x

Moyenne arithmétique des valeurs du caractère pour les n individus de la population

=

=

i i i

i

n

i

c

i

f c

x 1 n

(90)

4.3 Résumé numérique d’une distribution:

a. Caractéristiques centrales:

La moyenne notée x

Moyenne arithmétique des valeurs du caractère pour les n individus de la population

=

=

i i i

i

n

i

c

i

f c

x 1 n

On ne considère plus les valeurs des modalités, mais les CENTRES DES CLASSES

(91)

4.3 Résumé numérique d’une distribution:

a. Caractéristiques centrales:

La moyenne notée x

Moyenne arithmétique des valeurs du caractère pour les n individus de la population

=

=

i i i

i

n

i

c

i

f c

x 1 n

Représente le barycentre des valeurs prises par le

caractère

On ne considère plus les valeurs des modalités, mais les CENTRES DES CLASSES

(92)

100 1

26542481 Total

100 0.084

2225411 55 et +

91.6 0.125

3305278 50-54

79.2 0.139

3696642 45-49

65.2 0.142

3770300 40-44

51.0 0.146

3865252 35-39

36.5 0.142

3771554 30-34

22.3 0.137

3628502 25-29

8.6 0.086

2279542 15-24

Cumul .fi

Effectif Age

=

i

f

i

c

i

x

(93)

100 1

26542481 Total

100 0.084

2225411 55 et +

91.6 0.125

3305278 50-54

79.2 0.139

3696642 45-49

65.2 0.142

3770300 40-44

51.0 0.146

3865252 35-39

36.5 0.142

3771554 30-34

22.3 0.137

3628502 25-29

8.6 0.086

2279542 15-24

Cumul .fi

Effectif Age

60 53 47 43 37 33 27 20 .ci

=

i

f

i

c

i

20

x

2 24 15+ ≈

(94)

100 1

26542481 Total

100 0.084

2225411 55 et +

91.6 0.125

3305278 50-54

79.2 0.139

3696642 45-49

65.2 0.142

3770300 40-44

51.0 0.146

3865252 35-39

36.5 0.142

3771554 30-34

22.3 0.137

3628502 25-29

8.6 0.086

2279542 15-24

Cumul .fi

Effectif Age

60 53 47 43 37 33 27 20 .ci

0.086*20 + 0.137*27 + 0.142*33 + 0.146*37 + 0.142*43 + 0.139*47 + 0.125*53 + 0.042*60

=

i

f

i

c

i

x

(ans)

≈ 40 x

2 20 24 15+ ≈

(95)

100 1

26542481 Total

100 0.084

2225411 55 et +

91.6 0.125

3305278 50-54

79.2 0.139

3696642 45-49

65.2 0.142

3770300 40-44

51.0 0.146

3865252 35-39

36.5 0.142

3771554 30-34

22.3 0.137

3628502 25-29

8.6 0.086

2279542 15-24

Cumul .fi

Effectif Age

60 53 47 43 37 33 27 20 .ci

0.086*20 + 0.137*27 + 0.142*33 + 0.146*37 + 0.142*43 + 0.139*47 + 0.125*53 + 0.042*60

=

i

f

i

c

i

x

(ans)

≈ 40 x

2 20 24 15+ ≈

Ne pas oublier l’unité

En 1999 en France, les actifs

ont une moyenne d’âge de 40 ans

(96)

Classe(s) modale(s)

CLASSES en lesquelles l’histogramme des

fréquences présente un maximum RELATIF

Classes en laquelle la fréquence RELATIVE

présente un maximum RELATIF

(97)

Classe(s) modale(s)

CLASSES en lesquelles l’histogramme des fréquences présente un maximum RELATIF Classes en laquelle la fréquence RELATIVE présente un maximum RELATIF

0 2 4 6 8 10 12 14 16

0 10 20 30 40 50 60 Age en années

.f relatives à 5 ans

La classe modale est celle des 35-39 ans

(98)

La médiane

Valeur du caractère qui partage la série statistique en 2 groupes de même fréquence (0.5).

C’est la valeur correspondant à un effectif cumulé de

50% sur le polygone des fréquences cumulées

(99)

La médiane

Valeur du caractère qui partage la série statistique en 2 groupes de même fréquence (0.5).

C’est la valeur correspondant à un effectif cumulé de 50% sur le polygone des fréquences cumulées

0 20 40 60 80 100

0 10 20 30 40 50 60

Age en années

.f cumulées Graphiquement, on lit

que la médiane vaut un peu moins de 40

ans

(100)

La médiane

Valeur du caractère qui partage la série statistique en 2 groupes de même fréquence (0.5).

C’est la valeur correspondant à un effectif cumulé de 50% sur le polygone des fréquences cumulées

0 20 40 60 80 100

0 10 20 30 40 50 60

Age en années

.f cumulées Graphiquement, on lit

que la médiane vaut un peu moins de 40

ans

Peut on avoir une expression exacte de la

médiane?

(101)

Pour avoir la valeur de la médiane on réalise une

« interpolation linéaire ».

0 20 40 60 80 100

0 10 20 30 40 50 60

Age en années .f cumulées

(102)

Pour avoir la valeur de la médiane on réalise une

« interpolation linéaire ».

35 38 41 44 47 50

32 34 36 38 40 42

Age en années .f cumulées

35 36.5

40 M 50

51

Les accroissements

sur les abscisses et les ordonnées sont proportionnels

5 . 36 51

35 40

5 . 36 50

35 = − −

− −

M

(103)

Pour avoir la valeur de la médiane on réalise une

« interpolation linéaire ».

35 38 41 44 47 50

32 34 36 38 40 42

Age en années .f cumulées

35 36.5

40 M 50

51

Les accroissements

sur les abscisses et les ordonnées sont proportionnels

5 . 36 51

35 40

5 . 36 50

35 = − −

− − M

(ans) 7

. 5 39

. 36 51

35 ) 40

5 . 36 50

(

35 + − −− ≈

=

(104)

Pour avoir la valeur de la médiane on réalise une

« interpolation linéaire ».

35 38 41 44 47 50

32 34 36 38 40 42

Age en années .f cumulées

35 36.5

40 M 50

51

Les accroissements

sur les abscisses et les ordonnées sont proportionnels

5 . 36 51

35 40

5 . 36 50

35 = − −

− − M

(ans) 7

. 5 39

. 36 51

35 ) 40

5 . 36 50

(

35 + − −− ≈

50% des actifs ont plus

=

de 39.7 ans et 50 %

ont moins

(105)

b. Caractéristiques de dispersion:

Écart absolue, variance, écart-type

Idem caractère discret mais on prend le centre des classes comme valeur représentative

(106)

b. Caractéristiques de dispersion:

Écart absolue, variance, écart-type

Idem caractère discret mais on prend le centre des classes comme valeur représentative

1 26542481

Total

0.084 2225411

55 et +

0.125 3305278

50-54

0.139 3696642

45-49

0.142 3770300

40-44

0.146 3865252

35-39

0.142 3771554

30-34

0.137 3628502

25-29

0.086 2279542

15-24

.fi Effectif

Age

x ≈ 40 (ans)

60 53 47 43 37 33 27 20 .ci

(107)

b. Caractéristiques de dispersion:

Écart absolue, variance, écart-type

Idem caractère discret mais on prend le centre des classes comme valeur représentative

1 26542481

Total

0.084 2225411

55 et +

0.125 3305278

50-54

0.139 3696642

45-49

0.142 3770300

40-44

0.146 3865252

35-39

0.142 3771554

30-34

0.137 3628502

25-29

0.086 2279542

15-24

.fi Effectif

Age

60 53 47 43 37 33 27 20

.ci

x ≈ 40 (ans)

0.086 * |20-40|

+0.137 * |27-40|

+0.142 * |33-40|

+0.146 * |37-40|

+0.142 * |43-40|

+0.139 * |47-40|

+0.125 * |53-40|

+0.084 * |60-40|

(ans) 64

.

≈9 ex

0.086 * 202 +0.137 * 272 +0.142 * 332 +0.146 * 372 +0.142 * 432 +0.139 * 472 +0.125 * 532 +0.084 * 602

40

2

2=1712−

σ

) (

112

ans

2

) (ans 6

.

10

112 ≈

σ ≈

(108)

Le coefficient de variation

V = σ x

(109)

Le coefficient de variation

V = σ x

C’est un nombre SANS UNITE, donc plus pratique pour

comparer 2 distributions

(110)

Le coefficient de variation

V = σ x

C’est un nombre SANS UNITE, donc plus pratique pour

comparer 2 distributions

(111)

Le coefficient de variation

V = σ x

C’est un nombre SANS UNITE, donc plus pratique pour

comparer 2 distributions

Exemple: Prix d’un poisson rouge en Francs à Grenoble 6.5 F 19.5 F 33 F

Prix d’un poisson vert en euros à Grenoble 1 E 3 E 5 E

(F) 8

. 10

(F);

19.7

1

1

≈ σ ≈

x

(E) 63

. 1

(E);

3

2

1

≈ σ ≈

x

(112)

Le coefficient de variation

V = σ x

C’est un nombre SANS UNITE, donc plus pratique pour

comparer 2 distributions

Exemple: Prix d’un poisson rouge en Francs à Grenoble 6.5 F 19.5 F 33 F

Prix d’un poisson vert en euros à Grenoble 1 E 3 E 5 E

(F) 8

. 10

(F);

19.7

1

1

≈ σ ≈

x

(E) 63

. 1

(E);

3

2

1

≈ σ ≈

x

54 . 0

1

V

54 . 0

2

V

Références

Documents relatifs

En utilisant la r´ eciproque du th´ eor` eme des milieux dans le triangle ABC , I est le milieu de [AC], donc si (KI) ´ etait parall` ele ` a (BC ) alors K serait le milieu de

[r]

Déterminer, en justifiant chaque étape, les variations des fonctions suivantes sur l intervalle donné.. Conclure sur le sens de variation

Donc cette dernière somme est atteinte, ce qui entraîne l’égalité

Cet algorithme sera réalisé dans une fonction qui aura un certain nombre de paramètres dont le nom de la fonction mathématique dont on cherche le 0.. Testez sur

Pour que l’extension finie L/K soit galoisienne, il faut et il suffit que K co¨ıncide avec le corps des ´el´ements invariants par le groupe de tous les K-automorphismes de

Montrer que les points M 1 et M 2 varient sur un même cercle dont on précisera le centre et le rayon.. Etudier la dérivabilité de f à droite en 0 et interpréter graphiquement

[r]