• Aucun résultat trouvé

Cours et TD

N/A
N/A
Protected

Academic year: 2022

Partager "Cours et TD"

Copied!
26
0
0

Texte intégral

(1)

ISCAE

Notes de cours

Statistique descriptive

Dr. Sidi Mohamed MAOULOUD v 2015-2016

(2)

Table des matières

Chapitre 0. Quelques définitions ... 3

Chapitre 1. Série statistique à une dimension (univariée) ... 6

A. Les représentations graphiques ... 6

1. Variables qualitatives ... 6

2. Variables discrètes ... 7

3. Variables continues ... 7

B. Représentations numériques ... 9

1. Tendance centrale (position) ... 9

2. Dispersion ... 12

3. Forme ... 13

Chapitre 3. Indices statistiques ... 21

A. Indices élémentaires ... 21

B. Les indices synthétiques ... 22

(3)

Chapitre 0. Quelques définitions

La Statistique est l’ensemble de méthodes et outils mathématiques visant à collecter, décrire et analyser des données afin d'obtenir de l'information permettant de prendre des décisions malgré la présence d'incertitude.

La statistique est l'outil de confrontation d'une théorie scientifique à l'observation.

La statistique descriptive est l’étude de résultats observés (statistiques) sur des ensembles comportant un grand nombre d’observations dans le but de les condenser pour en avoir une vue synthétique. Ce condensé se fera en perdant un certain nombre d’observations mais en gardant l’allure générale du phénomène étudié.

A. Population, individu, échantillon

Population: collection complète (dans le sens où elle inclut tous les individus à étudier) d'individus sur laquelle porte l'étude

Individu : Chaque élément de la population s’appelle individu ou unité statistique

Echantillon: sous-ensemble d'individus obtenus à partir de la population (méthodes de sondage)

Paramètre: mesure numérique décrivant une caractéristique de la population

Une statistique: mesure numérique décrivant une caractéristique de l'échantillon

Variable ou Caractère: Caractéristique dont la valeur change d'un individu à l'autre dans la population

Donnée: fait numérique ou non porteur d'information

B. Variables

Chaque individu d’une population peut être décris par une ou plusieurs variables. Ces variables peuvent être

Variable qualitative: caractéristiques qui prend des valeurs non numériques qui sont appelées modalités. Une variable qualitative peut être :

o nominale: données non numériques qui ne peuvent pas être ordonnées (genre). Une variable est dite dichotomique: si elle ne prend que 2 modalités (comme le genre qui prends les modalités : Homme, Femme)

o ordinale: données non numériques possédant un ordre naturel (avis pédagogiques)

Exemple : Un questionnaire de satisfaction demande aux consommateurs d'évaluer une prestation en cochant l’une des six catégories suivantes : (a) nulle, (b) médiocre, (c) moyenne, (d) assez bonne, (e) très bonne, (f) excellente. Il s'agit de modalités ordinales puisqu'elles peuvent être hiérarchisées : une prestation excellente est meilleure qu'une prestation bonne, etc

Variable quantitative: variable numérique qui peut être : o discrète: valeurs numériques discrètes, isolées

Exemple : On a questionné 100 ménages sur le nombre d'ampoules électriques utilisées dans leur domicile. Les données sont regroupées par nombre d'ampoules.

o continue: valeurs numériques sur un intervalle continu

Exemple : On a mesuré 20 personnes et les résultats sont (en cm)

 Les données brutes sont souvent collectées dans tableau dit tableau des données

(4)

- n est nombre d’individus ou taille de la population ou de l’échantillon à étudier ;

- p est nombre de variables étudiées ;

- 𝑥𝑖,𝑗 est la valeur de la j-ème variable mesurée sur le i-ème individu.

- Ce tableau est appelé série statistique à p dimensions

Exemple.

Le tableau suivant résume des données d’un petit échantillon et sur un petit nombre de variables, choisis à titre illustratif, des données de l’Enquête Permanente sur les Conditions de Vie de ménages réalisée par l’office national des statistiques (ONS)

nombre de personne

âge du chef

Niveau d'éducation

Groupe socio-

économique milieu

dépense mensuelle

5 60 0 4 2 60418

7 42 3 4 2 28083

3 42 4 4 2 87777

6 45 2 5 2 33806

5 37 1 5 1 109695

2 70 5 5 1 96198

5 50 0 5 1 111463

4 32 0 1 1 47944

2 41 0 4 1 38642

5 60 5 7 1 45660

La population étudiée est l’ensemble des ménages mauritaniens. Les données disponibles sont celles d’un échantillon. Chaque ménage constitue une unité statistique (individu). Plusieurs paramètres sont concernés par l’étude, citions par exemple l’incidence de la pauvreté, la proportion des ménages de le chef est une femme, l’âge moyen des chefs de ménage etc.. Comme l’enquête ne porte que sur un échantillon, ces paramètres vont être estimés par des statistiques calculées à partir des données de l’échantillon. Les variables de ce tableau sont

- Nombre de personne qui compose le ménage : variable quantitative discrète ; - Age du chef de ménage : variable quantitative continue ;

- Niveau d’éducation du chef de ménage : variable qualitative ordinale ; - Groupe socio économique : variable qualitative nominale ;

- Milieu ou habite le ménage : variable qualitative nominale à deux modalité, urbain ou rural, donc dichotomique

- Dépense mensuelle : variable quantitative continue Variables

Individus

𝑋1 𝑋2 ⋯ 𝑋𝑗 ⋯ 𝑋𝑝

1 𝑥1,1 𝑥1,2 𝑥1,𝑗 𝑥1,𝑝 2 𝑥2,1 𝑥2,2 𝑥2,𝑗 𝑥2,𝑝

I 𝑥𝑖,1 𝑥𝑖,2 𝑥𝑖,𝑗 𝑥𝑖,𝑝

N 𝑥𝑛,1 𝑥𝑛,2 𝑥𝑛,𝑗 𝑥𝑛,𝑝

(5)

La dernière ligne correspond à un ménage composé de 5 personnes, dont le chef est âgé de 60 ans, ayant un niveau d’études supérieures (niveau =5) et qui est inactif (gse=7). Ce ménage habite en milieu rural (milieu=1) est dépense mensuellement 45 660 UM.

(6)

6

Chapitre 1. Série statistique à une dimension (univariée)

A. Les représentations graphiques 1. Variables qualitatives

La description d’une population selon une variable qualitative est totalement résumée dans un tableau de pourcentages ou dans un diagramme circulaire, appelé aussi diagramme en camembert Modalités Modalité 1 (𝑥1) Modalité 2 (𝑥2) ⋯ Modalité k (𝑥𝑘) ⋯ Modalité j (𝑥𝑗) Total

Effectifs 𝒏𝟏 𝒏𝟐 ⋯ 𝒏𝒌 ⋯ 𝒏𝒋 𝒏

 𝑛𝑘 est le nombre de fois ou apparait la modalité k dans la série il est appelé effectif de la modalité k ;

 j est le nombre de modalités distinctes observées ;

 La série univariée est donc résumée par 𝑥1 , 𝑛1 ; 𝑥2 , 𝑛2 ; … ; (𝑥𝑗 , 𝑛𝑗) ;

 Les fréquences 𝑓𝑘 =𝑛𝑘

𝑛 représentent la fréquence d'observations qui sont égales à 𝑥𝑘 ; Modalités Modalité 1 (𝑥1) Modalité 2 (𝑥2) ⋯ Modalité k (𝑥𝑘) ⋯ Modalité j (𝑥𝑗) Total

Effectifs 𝒏𝟏 𝒏𝟐 ⋯ 𝒏𝒌 ⋯ 𝒏𝒋 𝒏

Fréquence 𝒇𝟏 𝒇𝟐 ⋯ 𝒇𝒌 ⋯ 𝒇𝒋 𝟏

 Le diagramme en secteurs est une représentation graphique à l'aide d’un disque découpé en secteur. À chaque modalité observée correspond un secteur. Les angles 𝛼𝑘 des secteurs sont proportionnels aux effectifs représentés. Ces angles sont donnés par 𝛼𝑘 = 360 × 𝑓𝑘 Exemple

Charghi 72384

Gharbi 64219

Assaba 63565

Gorgol 50709

Brakna 73746

Trarza 96247

Adrar 22393

Nouadhibou 34526

Tagant 24838

Guidimagha 31585

Tiris 14963

Inchiri 5197

Nouakchott 186694

(7)

7 2. Variables discrètes

Considérons une variable observée sur une population de n individus. Si la variable X prend k valeurs ou ensembles de valeurs (appelés dans ce qui suit, modalités), le premier traitement des données brutes consiste à compter le nombre 𝑛𝑖 (appelé effectif) d’individus qui présentent la i-ème modalité Soit le tableau récapitulatif de la variable

- 𝑓𝑖 =𝑛𝑗

𝑛 est la fréquence - 𝑁𝑖 = 𝑖 𝑛𝑗

𝑗 =1 est l’effectif cumulé

- 𝐹𝑖 =𝑁𝑖

𝑛 est la fréquence cumulée

- 𝑁𝑖= 𝑘𝑗 =𝑖𝑛𝑗est l’effectif cumulé à droite

Diagramme en bâtons :

Il est construit dans un système d’axes rectangulaires ; les valeurs de la variable statistique X sont portées en abscisse à partir de chaque modalité on trace un segment de droite vertical et dont la hauteur est proportionnelle à l’effectif correspondant. On peut retenir indifféremment une échelle qui explicite les effectifs ou une échelle qui explicite les fréquences.

Exemple. On interroge 100 ménages sur le nombre de pièces de leur logement. On obtient le tableau suivant

𝑥𝑘 𝑛𝑘 𝑓𝑘 𝑁𝑘 𝐹𝑘 𝑁𝑘 𝐹𝑘 1 5 0,05 5 0,05 100 1 2 30 0,3 35 0,35 95 0,95 3 40 0,4 75 0,75 65 0,65 4 20 0,2 95 0,95 25 0,25 5 5 0,05 100 1 5 0,05

3. Variables continues

Le domaine de variation d’une variable statistique continue X est partagé en k parties. L’intervalle 𝑙𝑘; 𝑙𝑘+ fermé à gauche, ouvert à droite, est appelé k-ème classe (k = 1,2, …,j) ; son amplitude est égale à : 𝑎𝑘 = 𝑙𝑘+− 𝑙𝑘.

Il arrive que l’amplitude des classes extrêmes soit indéterminée : la première classe étant définie par

« moins de… », et la dernière par « plus de… ». Le choix des extrémités des classes se fait à partir des données brutes.

Le nombre de classe doit être modéré entre 4 et 10.

Modalités 𝑥1 𝑥2 ⋯ 𝑥𝑘 ⋯ 𝑥𝑗 Total

Effectifs 𝒏𝟏 𝒏𝟐 ⋯ 𝒏𝒌 ⋯ 𝒏𝒋 𝒏

Fréquence 𝒇𝟏 𝒇𝟐 ⋯ 𝒇𝒌 ⋯ 𝒇𝒋 𝟏

Effectif cumulé 𝑵𝟏 𝑵𝟐 ⋯ 𝑵𝒌 ⋯ 𝒏

Fréquence cumulée 𝑭𝟏 𝑭𝟐 ⋯ 𝑭𝒌 ⋯ 𝟏 Effectif cumulé à droite 𝒏 𝑵𝟐 ⋯ 𝑵𝒌 ⋯ 𝑵𝒋 Fréquence cumulée à droite 𝟏 𝑭𝟐 ⋯ 𝑭𝒌 ⋯ 𝑭𝒋

0 10 20 30 40 50

1 2 3 4 5

(8)

8

Une classe est un intervalle 𝑙𝑘; 𝑙𝑘+ ; son centre ou milieu est 𝑐𝑘 =𝑙𝑘+𝑙𝑘+

2 . Le nombre d’observations dans la classe k est noté 𝑛𝑘 et est appelé effectif de la classe. On résume les données dans le tableau récapitulatif de la variable

Histogramme. À la k-ème classe, correspond un rectangle dont la base est l’intervalle 𝑙𝑘; 𝑙𝑘+ et dont la surface est proportionnelle à la fréquence 𝑓𝑘(ou à l’effectif 𝑛𝑘).

Si les classes ont toutes la même amplitude, les hauteurs des rectangles sont proportionnelles aux fréquences. Dans le cas où les classes sont d’amplitudes inégales, la hauteur du rectangle correspondant à la k-ème classe d’amplitude 𝑎𝑘 sera 𝑕𝑘 = 𝑓𝑘

𝑎𝑘. La surface du rectangle représentant la k-ème classe sera ainsi égale à 𝑓𝑘. On peut également utiliser les effectifs ou fréquences cumulés

polygone relie le centre de l’histogramme par des segments

Courbe cumulative est une fonction croissante telle que : - 𝐹 𝑥 = 0 pour tout 𝑥 ≤ min 𝑥𝑖

- 𝐹 𝑥 = 1 pour tout 𝑥 ≥ max 𝑥𝑖 - Si 𝑥 ∈ 𝑙𝑘; 𝑙𝑘+ ,

𝐹 𝑥 =𝐹𝑘

𝑎𝑘 𝑥 − 𝑙𝑘 +𝐹𝑘−1

𝑎𝑘 𝑙𝑘+− 𝑥 = 𝐹𝑘−1+ 𝑓𝑘

𝑎𝑘 𝑥 − 𝑙𝑘

Courbe cumulative à droite

𝑥 ∈ 𝑙𝑘; 𝑙𝑘+ ; 𝐹 𝑥 = 𝐹𝑘+𝑓𝑘

𝑕𝑘 𝑥 − 𝑙𝑘 𝐹 𝑥 = proportion des observations inférieurs ou égal à 𝑥

Exemple. On a mesuré la taille de 20 personnes et les résultats sont (en cm) : {148, 165, 145, 173, 148, 145, 152, 180, 135, 170, 170, 170, 142, 148, 165, 175, 180, 180, 180, 180}. En les regroupant en 5 classes d’amplitudes égales on obtient

Classe 𝑙1; 𝑙1+ 𝑙2; 𝑙2+ ⋯ 𝑙𝑘; 𝑙𝑘+ ⋯ 𝑙𝑗; 𝑙𝑗+ Total

centre 𝑐1 𝑐2 ⋯ 𝑐𝑘 ⋯ 𝑐𝑗

Effectifs 𝒏𝟏 𝒏𝟐 ⋯ 𝒏𝒌 ⋯ 𝒏𝒋 N

Fréquence 𝒇𝟏 𝒇𝟐 ⋯ 𝒇𝒌 ⋯ 𝒇𝒋 1

Effectif cumulé 𝑵𝟏 𝑵𝟐 ⋯ 𝑵𝒌 ⋯ 𝒏

Fréquence cumulée 𝑭𝟏 𝑭𝟐 ⋯ 𝑭𝒌 ⋯ 𝟏

Effectif cumulé à droite 𝒏 𝑵𝟐 ⋯ 𝑵𝒌 ⋯ 𝑵𝒋 Fréquence cumulée à droite 𝟏 𝑭𝟐 ⋯ 𝑭𝒌 ⋯ 𝑭𝒋

(9)

9 𝑙𝑘; 𝑙𝑘+ 𝑐𝑘 𝑛𝑘 𝑓𝑘 𝑁𝑘 𝐹𝑘 𝑁𝑘 𝐹𝑘 [130-140[ 135 1 0,05 1 0,05 20 1 [140-150[ 145 6 0,3 7 0,35 19 0,95 [150-160[ 155 1 0,05 8 0,4 13 0,65 [160-170[ 165 2 0,1 10 0,5 12 0,6 [170-180] 175 10 0,5 20 1 10 0,5

B. Représentations numériques

Le tableau de distribution d’une variable statistique présente l’information recueillie sur cette variable. Une représentation graphique en fournit un portrait pour appréhender plus facilement la globalité de l’information. On peut désirer aller plus loin en cherchant à caractériser la représentation visuelle par des éléments synthétiques sur :

- la valeur de la variable située au « centre » de la distribution : la tendance centrale et, plus généralement, un indicateur de position non nécessairement centrale, liée à un rang donné ;

- la variation des valeurs : la dispersion ; - la forme de la distribution ;

- les aspects particuliers : valeurs extrêmes, groupes de valeurs…

Ces indicateurs étant exprimés dans les unités de la variable étudiée. Pour comparer plusieurs distributions entre elles il est intéressant de calculer des caractéristiques de dispersion relative.

1. Tendance centrale (position)

Les moyennes

a. Moyenne arithmétique 𝒙

o Se calcule pour les variables quantitatives comme suit :

Histogramme

taille en cm

Effectif

130 140 150 160 170 180

0246810

Courbe cumulative 0

0,2 0,4 0,6 0,8 1

130 140 150 160 170 180

(10)

10

Les données brutes Les variables discrete Les données regroupées en classe

𝑥 =1 𝑛 𝑥𝑖

𝑛

𝑖=1

=1

𝑛(𝑥1+ ⋯ + 𝑥𝑛)

𝑥 =1

𝑛 𝑛𝑖𝑥𝑖

𝑗

𝑖=1

=1

𝑛(𝑛1𝑥1+ ⋯ + 𝑛𝑗𝑥𝑗)

𝑥 =1

𝑛 𝑛𝑖𝑐𝑖

𝑗

𝑖=1

=1

𝑛(𝑛1𝑐1+ ⋯ + 𝑛𝑗𝑐𝑗) o Sensible face aux points aberrants

o La somme des valeurs observées est égale à 𝑛𝑥 o Si 𝑌 = 𝑎𝑋 + 𝑏 alors 𝑦 = 𝑎𝑥 + 𝑏

o Soit p séries de tailles 𝑛1, … , 𝑛𝑝 et de moyennes respectives 𝑥 1, … , 𝑥 𝑝 alors la moyenne de la série obtenu en regroupant toute les séries est donnée par

𝑥 =𝑛1𝑥 1+ ⋯ + 𝑛𝑝𝑥 𝑝 𝑛1+ ⋯ + 𝑛𝑝

o La série centrée est obtenu en retranchant de chaque valeur la moyenne, c-à-d, 𝑥𝑖− 𝑥 . La moyenne de la série centrée vaut toujours 0

b. Moyenne géométrique est utilisé uniquement pour les variable quantitatives Les données brutes Les variables discrètes Les données regroupées en

classe

𝑔 = 𝑥𝑖

𝑛

𝑖=1

𝑛

𝑔 = 𝑥𝑖𝑛𝑖

𝑗

𝑖=1

𝑛

𝑔 = 𝑐𝑖𝑛𝑖

𝑗

𝑖=1

𝑛

c. Moyenne harmonique

Les données brutes Les variables discrètes Les données regroupées en classe

𝑕 = 𝑛 1 𝑥𝑖

𝑛𝑖=1

𝑕 = 𝑛 𝑛𝑖 𝑥𝑖

𝑗 𝑖=1

𝑕 = 𝑛 𝑛𝑖 𝑐𝑖

𝑗 𝑖=1

Mode. Pour obtenir une mesure de la tendance centrale non influencée par les valeurs extrêmes de la distribution, on peut prendre la valeur – ou la classe de valeurs – du caractère pour laquelle le diagramme en bâtons – respectivement l’histogramme – présente son maximum : c’est le mode – respectivement l’intervalle modal – de la distribution ; dans le cas où le diagramme en bâtons ou l’histogramme – présente aussi un maximum local, il y a deux modes –respectivement deux classes modales.

(11)

11

La présence de plusieurs modes peut être du au fait que les données sont issues de populations différentes

Médiane 𝒙𝟎.𝟓 et quantiles

De façon générale le quantile d’ordre 𝑝 ∈]0,1[ est la valeur 𝑥𝑝 telle que 𝐹 𝑥𝑝 = 𝑝

a. Si la série est numérique non groupée alors la médiane est l’observation au centre de la série ordonnée (ou la moyenne des deux observations au centre si n est paire)

b. Si la série est groupé il faut d’abord déterminé la classe médiane qui est la classe 𝑙𝑘; 𝑙𝑘+ pour laquelle 𝐹𝑘−1 ≤ 0.5 et 𝐹𝑘 > 0.5. Ensuite la médiane est donnée par

𝑥0.5= 𝑙𝑘+ 𝑕𝑘 𝑛

2 − 𝑁𝑘−1

𝑛𝑘 = 𝑙𝑘+ 𝑕𝑘0,5 − 𝐹𝑘−1 𝑓𝑘 c. Pas influencée par des valeurs extrêmes

d. Pour des distributions dissymétriques, la médiane offre une meilleure représentation que la moyenne

e. La médiane représente la valeur au centre : la moitié est supérieur à cette valeur et la moitié lui est inférieur

Quantiles 𝒙𝒑

- Soit 𝑝 ∈ 0,1 le quantile d’ordre p est la valeur 𝑥𝑝 pour la quelle 𝑁 𝑥𝑝 ≥ 𝑛𝑝 et 𝑁 𝑥𝑝 ≥ 𝑛 1 − 𝑝

- Quartiles : médiane 𝑥0.5 quantile d’ordre 0.5 ; 𝑥0.25 premier quartile ; 𝑥0.75 troisième quartile. Ils sont notés 𝑸𝟏 et 𝑸𝟑

- Déciles notés 𝐷1, … , 𝐷10 sont les quantiles pour 𝑝 = 0.10, 0.20, … , 0.90 - Boite à moustache

On trace un rectangle de largeur fixée à priori et de longueur 𝐸𝐼𝑄 = (𝑄3 – 𝑄1), et on y situe la médiane par un segment positionné à la valeur 𝑄2, par rapport à 𝑄3 et 𝑄1 ; on a alors la boîte ;

on détermine 𝑥𝑕 la plus grande valeur inférieur à 𝑄3 + 1,5 𝐸𝐼𝑄 et 𝑥𝑏 la plus petite valeur inférieur à 𝑄1 – 1,5 𝐸𝐼𝑄 ;

On trace deux lignes allant des milieux des largeurs du rectangle aux valeurs 𝑥𝑏 et 𝑥𝑕

S’il y a des valeurs qui sont inférieures à 𝑥𝑏 ou supérieures 𝑥𝑕 elles sont représentées par des points et sont considérées comme valeurs aberrantes ou extrêmes

Exemple. Retour à l’exemple de la variable taille

On remarque 𝐹3= 0,4 < 0,5 et que 𝐹4= 0,5 ≥ 0,5 donc

𝑄2= 𝑙4+ 𝑕4 𝑛 2 − 𝑁3

𝑛4 = 160 + 10 × 20

2 − 8

2 = 170

(12)

12

De même on 𝐹1= 0,05 < 0,25 et que 𝐹2= 0,35 ≥ 0,25 donc

𝑄1= 𝑙2+ 𝑕2 𝑛 4 − 𝑁1

𝑛2 = 140 + 10 × 20

4 − 1

6 = 146,67 𝐹4= 0,5 < 0,75 et que 𝐹5= 1 ≥ 0,25 donc

𝑄3 = 𝑙5+ 𝑕53𝑛 4 − 𝑁4

𝑛5 = 170 + 10 ×320 4 − 10

10 = 170 On a 𝑄3 + 1,5 𝐸𝐼𝑄 = 170 + 1,5 170 − 146,67 =217,5

et 𝑄1 – 1,5 𝐸𝐼𝑄 = 146,67 − 1,5 170 − 146,67 =104,17 donc 𝑥𝑕 = 180 et 𝑥𝑏 = 135

2. Dispersion

Etendue 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛

Ecart interquartile 𝐸𝐼𝑄 = 𝑄3− 𝑄1 ; écart-interdécile 𝐷9− 𝐷1

Variance ;

Les données brutes Les variables discrètes Les données regroupées en classe

𝜎2=1 𝑛 (𝑥𝑖

𝑛

𝑖=1

− 𝑥 )2

=1 𝑛 𝑥𝑖2

𝑛

𝑖=1

− 𝑥 2

𝜎2=1

𝑛 𝑛𝑗(𝑥𝑖

𝑗

𝑖=1

− 𝑥 )2

=1

𝑛 𝑛𝑗𝑥𝑖2

𝑗

𝑖=1

− 𝑥 2

𝜎2=1

𝑛 𝑛𝑗(𝑐𝑖

𝑗

𝑖=1

− 𝑥 )2

=1

𝑛 𝑛𝑗𝑐𝑖2

𝑗

𝑖=1

− 𝑥 2

Soit une population de taille n composée de deux sous-populations de taille 𝑛1 et de taille 𝑛2. Soit X, une variable statistique observée sur la population, alors

𝜎2=1

𝑛 𝑛1𝜎12+ 𝑛2𝜎22+ 𝑛1 𝑥 1− 𝑥 2+ 𝑛2 𝑥 2− 𝑥 2

L’écart-type 𝜎 est la racine carrée de la variance. Si 𝑌 = 𝑎𝑋 + 𝑏, alors 𝜎𝑌 = |𝑎|𝜎𝑋

Les caractéristiques de dispersion relative

(13)

13

Ces caractéristiques permettent de comparer les distributions statistiques de plusieurs sous- ensembles d’une même population, ou de faire des comparaisons dans le temps ou dans l’espace.

Le coefficient de variation 𝜎𝑥 est défini pour des variables positives L’interquartile relatif 𝑄3𝑄−𝑄1

2

L’interdécile relatif 𝐷9𝐷−𝐷1

5

3. Forme

Asymétrie (Skewness) Le moment d’ordre r est définie par

Les données brutes Les variables discrètes Les données regroupées en classe

𝜇𝑟 =1 𝑛 (𝑥𝑖

𝑛

𝑖=1

− 𝑥 )𝑟 𝜇𝑟 =1

𝑛 𝑛𝑗(𝑥𝑖

𝑗

𝑖=1

− 𝑥 )𝑟 𝜇𝑟 =1

𝑛 𝑛𝑗(𝑐𝑖

𝑗

𝑖=1

− 𝑥 )𝑟

Le coefficient d’asymétrie de Fisher est défini par 𝛾1= 𝜇3

𝜎3 Le coefficient de Yule-Kendall est défini par 𝑄3+𝑄𝑄 1−2𝑄2

3−𝑄1 et une variante de ce coeficient est definie par 𝐷9+𝐷𝐷 1−2𝐷5

9−𝐷1

Ces coefficients d’asymétrie, sont nuls pour une distribution symétrique, négatif pour une distribution unimodale étalée vers la gauche, positif pour une distribution unimodale étalée vers la droite. Ils sont invariants par changement d’échelle et d’origine.

Aplatissement (Kurtosis)

Le coefficient d’aplatissement mesure l’aplatissement d’une distribution ou l’homogénéité de la population. Le coefficient d’aplatissement est ainsi défini

𝛾2 =𝜇4 𝜎4− 3

Ce coefficient est nul pour une distribution normale positif ou négatif selon que la distribution est plus ou moins pointue que la distribution normale de même moyenne et de même écart-type.

(14)

14

Concentration

La notion de concentration a été introduite à propos des distributions de salaires et de revenus. Cette notion est apparentée à celle de dispersion puisqu’elle concerne l’intensité du groupement des données. Elle ne s’applique qu’à des variables continues à valeurs positives, et pour des ensembles statistiques dont l’addition des caractères possède une signification

Construction de la courbe de concentration

Considérons la distribution d’une variable continue dont l’intervalle de variation est partagé en k classes dont les bornes sont 𝑥0, 𝑥1, … , 𝑥𝑘. Pour classe on calcule

- La fréquence cumulée 𝑞𝑖 = 𝐹𝑖 représente la proportion des individus dont la valeur de la variable est inférieur à 𝑥𝑖)

- La part cumulée 𝑅𝑖 qui représente la part dans la somme totale de la variable X des 𝑞𝑖 premiers individus 𝑅𝑖 = 𝑖𝑘=1𝑛𝑘𝑐𝑘

𝑛𝑘𝑐𝑘

𝐽 𝑘=1

Sur un diagramme cartésien, on représente les k points de coordonnées (𝑝𝑖 , 𝑞𝑖). Ces points s’inscrivent dans un carré OABC dont la longueur des côtés est égale à 1 (ou 100 si les proportions sont exprimées en pourcentage). La courbe qui joint les points successifs est la courbe de concentration ou courbe de Lorenz. L’aire de concentration est l’aire située entre la première bissectrice et la courbe de Lorenz

L’indice de Gini 𝐼𝐺 est égal au double de l’aire de concentration. Il est compris entre 0 et 1. Il est égal à 0 dans le cas d’une égalité parfaite et à 1 dans le cas d’une inégalité parfaite.

Il est donné par la formule suivante

(15)

15

Données brutes Donnés groupées

𝐼𝐺 = 𝑛𝑖=1 𝑛𝑗 =1|𝑥𝑖− 𝑥𝑗|

2𝑛(𝑛 − 1)𝑥 𝐼𝐺= 𝐽𝑖=1 𝐽𝑘=1𝑛𝑖𝑛𝑗|𝑐𝑖− 𝑐𝑗| 2𝑛(𝑛 − 1)𝑥 Dans la pratique on utilisera la formule suivante 𝐼 = 1 − 𝐽𝑖=1𝑓𝑖(𝑅𝑖+ 𝑅𝑖−1)

(16)

16 Exercice 1. (Pour s’entrainer)

Il y a au moins une réponse exacte par question

1. Pour une série d’observations d’une variable statistique : a) on peut calculer quatre quartiles

b) l’intervalle interquartile contient 50 % des observations c) le cinquième décile est égal à la médiane

d) 50 % des observations sont supérieures au premier quartile 2. Pour une variable statistique de distribution symétrique :

a) la moyenne est égale à la médiane

b) 50 % des observations sont supérieures à la moyenne c) (𝑄3– 𝑄1) = 2(𝑀𝑒 – 𝑄1)

3. Pour comparer des distributions de variables statistiques exprimées dans des unités différentes (par exemple des distributions de salaires exprimés dans des monnaies différentes), on peut utiliser les caractéristiques suivantes :

a) la médiane

b) l’étendue interquartile c) le coefficient de variation d) le rapport 𝐷9/𝐷1

4. Pour une série d’observations d’une variable statistique : a) la somme des écarts à la moyenne est nulle

b) l’écart absolu moyen à la moyenne est un indicateur de dispersion c) les trois quartiles sont des indicateurs de tendance centrale

5. Une étude des notes obtenues par deux classes d’une école à un test commun a fourni les résultats suivants :

Effectif Moyenne Ecart-type Médiane

Classe 1 20 12 4 12

Classe 2 30 10 6 12

a) la note moyenne des deux classes réunies est égale à 11 b) l’écart-type des notes des deux classes réunies est égal à 5 c) la médiane des notes des deux classes réunies est égale à 12

d) l’écart absolu moyen des notes à la médiane est inférieur ou égal à 4 pour la classe 1 Exercice 2.

Le tableau suivant donne la répartition des familles selon le nombre d’enfants de 1968 à 1999 : Enfants de 0 à 18 ans (milliers)

1968 1975 1982 1990 1999

Nombre de familles

sans enfant 5 302 5 836 6 508 7 900 8 679 1 enfant

2 enfants 3 enfants 4 enfants 5 enfants ou plus

2 723 2 052 1 063 481 441

3 110 2 374 1 088 427 342

3 303 2 734 1 081 310 183

3 281 2 756 1 063 259 132

3 317 2 772 1 008 230 91

1. Définir les populations étudiées, l’unité statistique, le caractère étudié et sa nature.

(17)

17

Effectif 180

Salaire moyen 15 400 Écart-type 3 620 1er décile 10 950 1er quartile 12 750

Médiane 14 800

3e quartile 17 660 9e décile 20 220

2. Après avoir calculé les fréquences, tracez les diagrammes en bâtons de ces distributions, et interprétez. Indiquez le mode.

3. Pour chacune des cinq années, calculez le nombre moyen d’enfants par famille et l’écart-type (on considérera le nombre moyen d’enfants des familles ayant cinq enfants ou plus égal à 6).

4. Commentez les résultats.

Exercice 3.

On a relevé pendant 50 quinzaines successives les niveaux de ventes, exprimés en milliers d’unités de produit, de deux présentations notées G (Gel) et P (Poudre) d’un même produit. Les résultats sont les suivants

Présentation P

Niveau de vente < 10 [10-12[ [12-16[ [16-20]

Nombre de quinzaines 10 25 10 5

1. Déterminer les unités statistiques la variable d’étude et sa nature

2. Calculez les moyennes, écarts-types et médianes des niveaux de ventes pour chacune des deux présentations. Quelle est la condition nécessaire sur la moyenne et la médiane d’une distribution pour que celle-ci soit symétrique ?

3. Sur l’ensemble des points de vente pour toute la période de l’étude, on disposait de 30 % du produit en gel, et de 70 % du produit en poudre. Quel a été le niveau de ventes moyen et l’écart-type pour l’ensemble des deux présentations du produit ?

4. Les niveaux de ventes étant maintenant exprimés en centaines d’unités de produit, donnez les nouvelles valeurs des moyennes, écarts-types et médianes calculées à la 2ème question.

Exercice 4.

Afin d’étudier les disparités de salaires entre hommes et femmes, une enquête a été réalisée auprès du personnel ouvrier d’un secteur industriel. Les résultats concernant les salaires annuels nets en euros sont résumés dans les deux tableaux suivants :

Tableau 1. Hommes Tableau Femmes Salaire annuel (en milliers d’€)

Nombre d’ouvrières

[10 ; 12[

[12 ; 14[

[14 ; 16[

[16 ; 20]

[16 ; 20]

82 34 12 𝑛4

Total N

Présentation G

Niveau de vente < 5 [5-10[ [10-12[ [12-20]

Nombre de quinzaines 5 20 15 10

(18)

18

1. Définir la population étudiée, l’unité statistique, le caractère étudié et sa nature.

2. Proposez pour la distribution du salaire des hommes en précisant les valeurs correspondantes :

• trois indicateurs de tendance centrale ;

• deux indicateurs de dispersion ;

• deux indicateurs de dispersion relative.

3. Sachant que le salaire annuel moyen des femmes enquêtées est égal à 12 000 €, déterminez l’effectif 𝑛4 de la dernière classe de la distribution du salaire des femmes, ainsi que l’effectif total N. Déterminer l’écart-type.

4. Déterminez l’écart-type et le coefficient de variation de la distribution des femmes.

5. Déterminez le salaire annuel moyen et l’écart-type de l’ensemble des ouvriers hommes et femmes de l’enquête.

Exercice 5.

Le prix d’un Kg de bananes coute 500UM, celui de pommes coute 800UM, celui des mangues 300UM et celui des poires coute 900UM.

1. Quel est le prix moyen d’un Kg d’un panier de fruits (bananes, pommes, mangues, poires) a. Constituée des mêmes quantités de chaque fruit. De quel moyenne s’agit-il ?

b. Constituée des mêmes valeurs pour chaque fruit. De quel moyenne s’agit-il ?

2. Quel est le prix moyen d’un Kg d’un panier de fruits (bananes, pommes, mangues, poires) a. Dont 10%, 20%, 30% et 40% de la quantité sont respectivement des bananes, pommes,

mangues et poires. De quelle moyenne s’agit-il ?

b. Dont 10% , 20%, 30% et 40% de la valeur sont respectivement des bananes, pommes, mangues et poires. De quelle moyenne s’agit-il ?

Exercice 6.

Une même somme S a été confiée à deux banques B1 et B2 pour une durée de 10 ans. Les rendements successifs des placements effectués par les deux banques ont été les suivants :

• Banque B1 : 12 % pendant 2 ans, puis 8 % pendant 4 ans, puis 6 % pendant 4 ans ;

• Banque B2 : 10 % pendant 3 ans, puis 8 % pendant 3 ans, puis 7 % pendant 4 ans. Les intérêts sont toujours capitalisés en fin d’année.

1. Calculez le taux moyen de croissance du placement dans chaque banque.

2. À quel taux la moins performante des deux banques aurait-elle dû placer l’argent pendant la troisième période pour égaler l’autre ?

Exercice 7.

Le tableau suivant donne la dépense annuelle en 2008 des ménages en Mauritanie, en ouguiya, pour les dix intervalles définis par les déciles

(19)

19

Décile Valeur du décile intervalle Moyenne de l’intervalle

D1 466116 <D1 313668

D2 682008 [D1;D2[ 578244

D3 868200 [D2;D3[ 775656

D4 1061424 [D3;D4[ 968472

D5 1296216 [D4;D5[ 1174632

D6 1573956 [D5;D6[ 1426104

D7 1921284 [D6;D7[ 1738812

D8 2483532 [D7;D8[ 2174820

D9 3471072 [D8;D9[ 2900148

>=D9 5941812

1. Définir la population, l’unité statistique, le caractère étudié et sa nature.

2. Calculez la dépense mensuelle moyenne des ménages.

3. Est-il légitime de faire l’hypothèse d’équirépartition dans les classes définies par les déciles ? 4. Proposez trois indicateurs de tendance centrale, un indicateur de dispersion et un indicateur

de dispersion relative. Donnez les valeurs de ces indicateurs.

5. Cette distribution de revenus est-elle symétrique ? (justifiez votre réponse)

6. Calculer 𝐷9/𝐷1 et interpréter ce résultat. 𝐷9/𝐷1 est un indicateur de disparité des revenus.

7. Soit 𝑅𝑖 la part de l’ensemble des revenus perçus par l’ensemble des 𝐹𝑖 ménages aux revenus les plus faibles. Calculer les 𝑅𝑖. Quelle est la part de l’ensemble des revenus perçus par les 4 dixièmes des ménages aux revenus les plus faibles ?

8. Soit 𝐹1 = 10 %, 𝐹2 = 20 %, … , 𝐹10 = 100 %. Tracez la courbe joignant, dans l’ordre, les points ( 𝐹𝑖 , 𝑅𝑖). Comment s’appelle cette courbe ?.

9. Donner approximativement l’abscisse du point de cette courbe d’ordonnée 50%. Interpréter.

Même question pour l’ordonnée du point de la courbe d’abscisse 50%.

10. Calculer l’indice de Gini Exercice 8.

Le tableau suivant donne le nombre (en milliers) et la superficie agricole utilisée (SAU, en milliers d’ha) des exploitations agricoles en France métropolitaine par classes de grandeur pour les années 1979, 1988, 2000 et 2005.

1979 1988 2000 2005

Nombre Nombre Nombre Nombre

Moins de 5 5 à moins de 20 20 à moins de 50 50 à moins de 100 100 à moins de 200 200 à moins de 360

357 410 347 114 29

6

278 279 288 128 37

7

193 132 138 122 64 15

132 104 109 113 70 17

1. Calculez, en pourcentage, les taux annuels moyens de variation du nombre des exploitations agricoles de 1979 à 1988, de 1988 à 2000, de 2000 à 2005. Exprimez le taux annuel moyen de

(20)

20

variation de 1979 à 2005 en fonction de ces 3 taux, de quel type de moyenne s’agit-il ? Calculez sa valeur et interpréter

2. Pour les années 1979, 1988, 2000 et 2005, calculez la SAU moyenne et interpréter par rapport au résultat de la question 1.

3. Pour l’année 2005,

a. représentez l’histogramme de la distribution des exploitations agricoles, b. ainsi que la courbe de concentration de la SAU.

c. Calculer l’indice de Gini pour la SAU pour l’année 2005. En 2000 l’indice de Gini était 0,606, commenter l’évolution de l’indice de Gini de 2000 à 2005.

(21)

21

Chapitre 2. Indices statistiques

Exemple 1. Entre janvier 2006 et janvier 2010, l’évolution des prix et du nombre d’exemplaires de journaux vendus en un mois par une société de presse éditant trois journaux mensuels A, B et C a été la suivante :

janvier 2006 janvier 2010

Prix (en euros) Quantité Prix (en euros) Quantité

Journal A 2,5 8 000 3 6 500

Journal B 4 4 000 4,5 5 000

Journal C 5 2 000 6 1 500

A. Indices élémentaires

On appelle indice élémentaire de la grandeur simple x à la date (ou au lieu) t dite date courante par rapport à la date 0, dite date (lieu) de référence le rapport : 𝐼𝑡/0 =𝑥𝑡

𝑥0. Les indices de date sont appelés indices temporels et ceux des lieux sont appelés spatiaux.

Il est d’habitude de multiplier les indices par cent pour éviter de manipuler trop de chiffre après la virgule.

Exemple 2: La population française était au nombre de 53 731000 habitants le 1/1/80 et au nombre de à 565 77000 habitants le 1/1/90 et au nombre de 58 749000 d’habitants au 1/1/00. Ainsi

100 ∗ 𝐼90/80 = 100 ∗56577000

53731000= 105,3

100 ∗ 𝐼00/80 = 100 ∗58749000

53731000 = 109,3

100 ∗ 𝐼00/90= 100 ∗58749000

56577000 = 103,8

La population française a augmenté de 5,3% sur la période 80 à 90, de 3,8% sur la période 90 à 00 et de 9,3% sur toute la période 80 à 00.

On remarque que 𝐼00/80 = 𝐼00/90∗ 𝐼90/80

Propriétés

- Circularité : 𝐼𝑡/0 = 𝐼𝑡/𝑡′∗ 𝐼𝑡′/0. Cette formule permet de changer de base en passant de la date de référence 0 à la date de référence t’. On a souvent besoin de mesurer l’évolution entre des dates différentes de la date de référence. Elle se généralise à

𝐼𝑡/0 = 𝐼𝑡/𝑡−1∗ 𝐼𝑡−1/𝑡−2∗ … ∗ 𝐼1/0

(22)

22 - Réversibilité : 𝐼𝑡/0 = 1

𝐼0/𝑡. Cette propriété trouve son intérêt dans la comparaison spéciale car le lieu de référence est arbitraire.

- Multiplication : si une quantité 𝑧 = 𝑥 × 𝑦 alors 𝐼𝑡/0(𝑧) = 𝐼𝑡/0(𝑥) × 𝐼𝑡/0(𝑦) .

B. Les indices synthétiques

Les indices élémentaires retracent l’évolution d’une seule grandeur parfaitement définie et homogène. Mais souvent on désire suivre les variations de grandeurs complexes telles que les prix des produits de consommation, la production industrielle. Ces grandeurs complexes sont composées d’un nombre de grandeurs simples dont l’évolution de chacune est décrite par un indice élémentaire.

On appelle indice synthétique, un indice faisant intervenir dans son calcul plusieurs grandeurs intéressant un même phénomène économique. On l’obtient en calculant une moyenne pondérée d’indices élémentaires.

Indices de Laspeyres et Paasche

Soient 𝑝𝑡𝑖 les prix unitaires de à la date t des 𝑞𝑡𝑖 quantités non sommables. La valeurs de ces biens est donnée par 𝑉𝑡= 𝑝𝑖 𝑡𝑖𝑞𝑡𝑖. On peut définir l’indice élémentaire de valeur

𝐼𝑡/0 𝑉 =𝑉𝑡

𝑉0= 𝑝𝑖 𝑡𝑖𝑞𝑡𝑖 𝑝𝑖 0𝑖𝑞0𝑖

Pour séparer les deux influences et chiffrer les variations « moyennes » des prix et celles des quantités, il est nécessaire de recourir à des indices synthétiques.

On définit les indice de Laspeyres des prix et des quantités par 𝐿𝑡/0 𝑝 = 𝑝𝑖 𝑡𝑖𝑞0𝑖

𝑝𝑖 0𝑖𝑞0𝑖 = 𝑝0𝑖𝑞0𝑖 𝑝𝑖 0𝑖𝑞0𝑖

𝑖

𝑝𝑡𝑖

𝑝0𝑖 = 𝑘0𝑖

𝑖

𝐼𝑡/0 𝑝𝑖

𝐿𝑡/0 𝑞 = 𝑝𝑖 0𝑖𝑞𝑡𝑖 𝑝𝑖 0𝑖𝑞0𝑖

= 𝑝0𝑖𝑞0𝑖 𝑝𝑖 0𝑖𝑞0𝑖

𝑖

𝑞𝑡𝑖

𝑞0𝑖 = 𝑘0𝑖

𝑖

𝐼𝑡/0 𝑞𝑖

Ici 𝑘0𝑖 s’interprète, comme le coefficient budgétaire du produit i, c’est-à-dire la part de dépense totale qui lui est consacrée, à la période de base. On les appelle également les pondérations qui sont calculées une fois à la date de base et on les utilise pour calculer les indices pour les dates postérieures.

(23)

23

Les pondérations suivantes résultent d’une enquête budget-consommation réalisée auprès des ménages à revenus moyens en Mauritanie. Il date de 1985 et servent à calculer le IPC (indice des prix à la consommation) dont la base de référence est justement l’année 1985.

Source : ONS (Office National des Statistiques)

On remarque que 𝑘𝑖 0𝑖 = 1. Donc les indices de Laspeyres des prix et des quantités sont les moyennes arithmétiques, pondérées par les coefficients budgétaires à la date 0, des indices élémentaires.

On définit également les indice de Paasche des prix et des quantités par Π𝑡/0 𝑝 = 𝑝𝑖 𝑡𝑖𝑞𝑡𝑖

𝑝𝑖 0𝑖𝑞𝑡𝑖 = 1 𝑝𝑡𝑖𝑞𝑡𝑖 𝑝𝑖 𝑡𝑖𝑞𝑡𝑖

𝑖 𝑝0𝑖

𝑝𝑡𝑖

= 1

𝑘𝑡𝑖 1 𝐼𝑡/0 𝑝𝑖

𝑖

Π𝑡/0 𝑞 = 𝑝𝑖 𝑡𝑖𝑞𝑡𝑖

𝑝𝑖 𝑡𝑖𝑞0𝑖 = 1 𝑝𝑡𝑖𝑞𝑡𝑖 𝑝𝑖 𝑡𝑖𝑞𝑡𝑖

𝑖

𝑞0𝑖 𝑞𝑡𝑖

= 1

𝑘𝑡𝑖 1 𝐼𝑡/0 𝑞𝑖

𝑖

Donc les indices de Paasche des prix et des quantités sont les moyennes harmoniques, pondérées par les coefficients budgétaires à la date t, des indices élémentaires.

Relation entre les deux indices On a

I𝑡/0 𝑉 = L𝑡/0 𝑝 × Π𝑡/0 𝑞 = L𝑡/0 𝑞 × Π𝑡/0 𝑝

La moyenne harmonique est inférieure à la moyenne arithmétique, mais on ne peut comparer les indices de Laspeyres et de Paasche que si les coefficients de pondération sont les mêmes. Mais souvent l’indice de Paasche est plus petit que l’indice de Laspeyres.

Conformément à la loi économique de l’offre et de la demande, les consommateurs ont tendance à acheter moins lorsque les prix sont élevés et à acheter davantage quand les prix baissent. Supposons que l’ait dans un contexte inflationniste, le numérateur l’indice de Laspeyres est un peu plus fort qu’il ne devrait l’être, car, conformément à la loi de l’offre et de la demande, les consommateurs ont tendance à acheter moins de biens de prix élevés et davantage de biens bon marché. Il en résulte que le coût total sera inférieur à celui donné par 𝑝𝑖 𝑡𝑖𝑞0𝑖 . Ainsi, l’indice de Laspeyres a tendance à surévaluer une hausse. A l’inverse, l’indice de Paasche a tendance à sous-évaluer une hausse.

On définit l’indices de Fisher par

(24)

24

𝐹𝑡/0(𝑝) = L𝑡/0 𝑝 × Π𝑡/0 𝑝 𝑒𝑡 𝐹𝑡/0(𝑞) = L𝑡/0 𝑝 × Π𝑡/0 𝑝 On peut facilement vérifier que 𝐼𝑡/0(𝑉) = 𝐹𝑡/0(𝑝) × 𝐹𝑡/0(𝑞)

Propriétés

- Circularité : Les trois indices ne sont pas circulaires

- Réversibilité : Les indices de Laspeyres et Paasche ne sont pas reversibles mains on a L𝑡/0 𝑝 =

1

Π0/𝑡 𝑝 donc l’indice de Fisher est réversible.

- Multiplication : Les indices de Laspeyres et Paasche ne sont pas mulitiplicatifs mains on a I𝑡/0 𝑉 = L𝑡/0 𝑝 × Π𝑡/0 𝑞 = L𝑡/0 𝑞 × Π𝑡/0 𝑝 .

D’où l’indice de Fisher est multiplicatif.

- Agrégation : Les indices de Laspeyres et de Paasche ont des structures de moyenne. Il en résulte que l’indice de Laspeyres (resp. de Paasche) d’un ensemble peut s’obtenir à partir des indices des groupes formant cet ensemble en leur appliquant la formule de Laspeyres

(25)

25 Exercice 1.

Les taux annuels moyens de croissance du PIB à prix constant en Mauritanie ont été les suivants de 2007 à 2011 (source : Banque centrale de Mauritanie) :

2007 2008 2009 2010 2011 PIB à prix constant 1,0 3,7 -1,2 5,1 4,0

a. le taux de croissance sur les cinq années est-il la somme des cinq taux de croissance ?

b. le taux annuel moyen de croissance sur la période 2007 – 2011 est-il égal à la moyenne arithmétique des taux annuels moyens de croissance ?

c. le taux annuel moyen de croissance sur la période 2007 – 2011 se calcule t-il à l’aide d’une moyenne géométrique ?

d. pour la période 2008 – 2010, le taux de croissance du PIB a t-il été de 7,7 % ? Exercice 2.

Une entreprise utilise pour ses fabrications trois types de matières premières qui sont notées respectivement A, B et C.

En 2000 et 2004, les prix observés et les quantités achetées par cette entreprise ont été les suivants : Matières

premières

Prix par tonne en euros 2000

Quantités achetées en tonnes en 2000

Prix par tonne en euros 2004

Quantités achetées en tonnes en 2004

A 800 10 900 6

B 500 4 700 4

C 600 5 600 8

1. Calculez les indices élémentaires rendant compte de l’évolution des prix de chacune des matières premières entre 2000 et 2004.

2. Calculez la moyenne arithmétique des indices élémentaires précédents pondérée par la part des dépenses engagées par l’entreprise pour chacune de ces matières premières en 2000. De quel indice s’agit-il ?

3. Effectuez le même calcul pour rendre compte de l’évolution des quantités entre 2000 et 2004.

4. Calculez l’indice mesurant l’évolution globale des dépenses de matières premières entre 2000 et 2004.

5. Déterminez, en utilisant les résultats des questions précédentes, les taux de variation (exprimés en pourcentage) des prix, des quantités et de la dépense totale. Comment s’explique l’évolution de la dépense totale ?

Exercice 3.

Entre 1980 et 2000, les quantités de sel extraites d’une mine ont été multipliées par 1,5 entre 1980 et 1985, sont passées de l’indice 130 en 1985 à l’indice 168 en 1992 avant d’augmenter de 6 % par an entre 1992 et 2000.

(26)

26

1. Quel est le taux annuel moyen de variation des quantités de sel extraites entre 1980 et 2000

?

2. Au cours de la même période, le taux de variation annuel moyen du prix du sel a été de – 5

%. Quelle est la valeur de l’indice du chiffre d’affaire en 2000, base 1980 ?

Exercice 4.

On dispose des données suivantes de l’indice des prix à la consommation en Mauritanie base 100 en 1985

Années 86 87 88 89 90 91 92 93

Pondérations

Alimentation 52 108,7 122,1 125 147,4 152,9 157 168,9 185 Habits 14,6 113,2 113,3 109,2 112,2 115,4 119,1 153,1 160,2 Habitations 25,3 103,4 111 113,3 125,2 142,7 158,7 172,9 193,6 Divers ? 101,6 100,2 100,6 103,8 114,7 129,7 134,8 143,9

GLOBAL 107,4

1. Déterminer la pondération de produits divers.

2. Déterminer les indices globaux des années 87 à 93

3. Déterminer l’évolution moyenne de l’IPC sur la période 86 à 93

4. Si une quantité coute en moyenne 2000 UM en 1988, quel serait son cout en moyenne en 1992.

Exercice 5.

Le tableau suivant est un extrait du tableau « Production et valeur ajoutée de l’agriculture

2008 2008/2007en %

Mds

d’euros Volume Prix Valeur

Produits végétaux 38,2 3,6 ? -0,3

Céréales 10,7 19,2 -21,3 -6,2

Oléagineux, protéagineux 2,4 4,8 ? 3,2

Betteraves industrielles 0,8 -7,2 -3,4 -10,3

Autres plantes industrielles 0,3 -2,9 13,5 10,3

Fruits, légume 7,4 -3,1 6,3 ?

Vins 9,4 ? 3,7 -2,1

Fourrages, plantes 7,4 -1,2 9,7 8,4

1. Déterminer les valeurs manquantes

2. Donnez l’indice de valeur de la production des « Produits végétaux » en 2008, base 100 en 2007. Même question pour « Oléagineux, protéagineux » et pour « Vins ».

3. Calculez l’évolution 2008/2007 (en pourcentage) des prix à la production des « Produits végétaux ». Même question pour « Oléagineux, protéagineux ».

4. Calculez l’évolution 2008/2007 (en pourcentage) du volume de la production des « Vins » ainsi que l’évolution en valeur de « Fruits et légumes »

5. Commentez les résultats obtenus.

6. Calculer l’indice de Paasche des prix des produits agricoles en 2008 base 100 en 2007 7. Calculer l’indice de Laspeyres des prix des produits agricoles en 2008 base 100 en 2007

Références

Documents relatifs

Dans la Figure 5 (a), la pente (droite) de la loi exponentielle pour les points non inond´es est plus ou moins parall`ele `a celle pour les d´ebits d’´ecoulement. Le petit d´ecalage

sont des distributions asymptotiques de valeurs extrêmes en deux dimensions dont les marges sont les distributions de valeurs extrêmes en une dimension. La formule

Nous envisagerons les premières et les dernières valeurs et nous calculerons l’espérance mathé- mathique et les moments de ces valeurs dans le cas d’une

Donc comme la moyenne, la plus grande valeur dans ces cas très généraux donne des informations sur une variable aléatoire mais les choses sont moins simples.. « En gros » la

Dans l’Activité 1 nous avons vu qu’un alternateur et un générateur basse fréquence, ou GBF, produisaient une tension variable dans le temps, prenant alternativement des

(Pour ne pas générer d'erreur cette valeur doit être un nombre entier) Entrez par exemple la valeur 0.. Le tableau de

Analyser la série temporelle de vent avec la méthode POT et comparer avec les résultats obtenus avec ceux des questions précédentes?. Exercice 3 On considère la série temporelle

Quelle est la probabilité que l’éolienne soit détruite au cours de sa première année de fonctionnement.. Quelle est l’espérance du montant des sinistres au cours de la