Année académique 2002-2003 : Statistiques : Corrigé de la 2
èmeséance
Paramètres de dispersion, courbes de Lorenz et indices de Gini
Exercice 2.6
On peut dresser le tableau suivant:
Classes xj Fj C(xj ) xjFj xj x xj x Fj
5£ <10 7.5 8 8 60 6.15 49.20
10£ <15 12.5 69 77 862.5 1.15 79.35
15£ <20 17.5 15 92 262.5 3.85 57.75
20£ <25 22.5 8 100 180 8.85 70.80
Total 100 1365 257.10
a) Les déciles séparent les observations en 10 parties égales.
10
100 ) .
( i
x C x
di k k
Par interpolation linéaire (si variable quantitative continue) , on obtient:
) (
10 soit , 1449 . 10 69 5
8 10 10
15]
[10 classe d
n observatio 10ème
la trouve se
où cherche on
décile, premier le
er Pour trouv ns.
observatio 100
a y Il
décile ième du classe de intervalle a
décile ième du classe la de effectif )
F(x
décile ième du classe la précédant classe
la de cumulé effectif
) 1 C(x
décile ième du classe la de inférieure borne
e
décile ième d
avec
. ) 1 10 (
1 1
d d
d 1 - d i
1
i i
i i
FB de milliers d
F a x iN C e
d i
i i
i d
d d d
i
<
£
Interprétation : 10% des chômeurs complets indemnisés de sexe féminin ont une allocation mensuelle inférieure ou égale à 10 milliers de FB.
(10.1449 milliers de FB)
b) Les terciles séparent les observations en trois parties égales.
3
100 ) .
( i
x C x
ti k k
Par interpolation linéaire, on obtient:
) (
12 soit , 8357 . 11 69 5
3 8 100 10
15]
[10 classe t
) 1 3 (
1 1
1
FB de
milliers t
F a x iN C e
t i
i i
i t
t t t
i
<
£
Interprétation : 1/3 des chômeurs complets indemnisés de sexe féminin ont une allocation mensuelle inférieure ou égale à 12 milliers de FB.
(11.8457 milliers de FB) c) I = Q3 – Q1
4
100 ) .
(x i C
x Qi k k
Q1 classe [10£ <15]
) (
11 soit , 2319 . 11 69 5
8 10 25
1 milliers de FB
Q
Q3 classe [10£ <15]
) (
15 soit , 8551 . 14 69 5
8 10 75
3 milliers de FB
Q
4 soit , 6232 . 3 2319 . 11 8551 .
1 14
3
Q Q
I (milliers de FB)
Interprétation : L'écart qui existe entre les deux valeurs qui bornent la partie centrale de la distribution (définie comme celle qui comprend 50% des observations) est de 3.6232 (milliers de FB).
d) 1 1365100 13.65 ,soit 14 ( )
1
FB de
milliers F
N x
x k
j j
j
k
j
j
j x F milliers de FB
N x MAD
1
) (
3 soit , 571 . 100 2
10 . 257 1
Interprétation : En moyenne, les chômeurs complets indemnisés de sexe féminin s'écartent, du point de vue de leur allocation mensuelle, de 2.571 (milliers de FB) en plus ou en moins de l'allocation moyenne de 13.65 (milliers de FB).
i i
i
i Q
Q Q Q
i a
F x iN C e
Q
( 1)
1 4
Exercice 2.13
xj Fj xjFj xj²Fj
100 50 5 000 500 000
120 30 3 600 432 000
160 80 12 800 2 048 000
Total 160 21 400 2 980 000
Exercice 3.6
Après avoir analysé les différents renseignements mentionnés dans l'énoncé, on se rend compte qu'on peut directement dresser les tableaux suivants:
A. Pour la distribution des revenus des ménages belges
Classes c(xj)=zi g(xj) G(xj)= yi zi-1 yi yi-1 zi
Classe 1 0.2 0.08 0.08 - -
Classe 2 0.4 0.14 0.22 0.044 0.032
Classe 3 0.6 0.19 0.41 0.164 0.132
Classe 4 0.8 0.23 0.64 0.384 0.328
Classe 5 1.0 0.36 1.00 0.800 0.640
total 1.392 1.132
Remarque: Nous traitons ici un cas un peu particulier puisque chaque classe à même proportion (20%) dans la population totale !!!
B. Pour la distribution des revenus des ménages brésiliens
classes c(xj)=zi yi zi-1 yi yi-1 zi
Classe 1 0.2 0.02 - -
Classe 2 0.4 0.07 0.0140 0.0080
Classe 3 0.6 0.16 0.0640 0.0420
Classe 4 0.8 0.33 0.1980 0.1280
x x
x x
x k
j
j j k
j
j j
x V x
N x F x F x
95 . 0
95 . V 0
donc ,
7718 .
25 95
. 0 et
francs 127.0625
x 0.95 w
0 b et 0.95 a
0.95x
w
5%) de réduction avec
(prix variable
nouvelle une
définit On
d2)
2192 .
75 0 . 123
1282 .
V 27 donc ,
et francs 123.75
10 - x z
-10 b
et 1 a
10 - x z
b ax z
francs) 10
de réduction une
avec (prix variable
nouvelle une
définit On
d1)
2028 .
75 0 . 133
1282 .
27 V x
c)
francs 27
soit 1282 .
27 )
2862250 2980000
160( ) 1
² N (
b) 1
francs 134
soit 75 . 160 133
21400 N
x 1 a)
z w
z z
1 2 1
gBel. = 1.392-1.132=0.260
Classe 5 1.0 1.00 0.8000 0.3300
total 1.076 0.508
=> gBel. < gBrésil
Il apparaît donc que la distribution des revenus est beaucoup plus inégalitaire au Brésil qu'en Belgique.
Courbes de Lorenz
Courbe de Lorenz (Belgique)
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
0 0.2 0.4 0.6 0.8 1
c(xi)=zi
G(xi)=yi
Droite d'équirépartition Courbe de Lorenz
Courbe de Lorenz (Brésil)
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
0 0.2 0.4 0.6 0.8 1
c(xi)=zi
G(xi)=yi
Droite d'équirépartition Courbe de Lorenz
Exercice 3.7
Il s'agit d'étudier l'égalité dans la répartition du nombre de km² par habitant (ici la variable x) en utilisant le schéma de la courbe de Lorenz.
N.B. : la construction de la courbe de Lorenz nécessite que les données soient ordonnées. Les unités statistiques les plus défavorisées étant ici bien entendu les continents dont la densité de population est la plus forte, c'est-à-dire pour lesquels le nombre de km² par habitant est le plus faible.
Pour construire la courbe de Lorenz, il peut être utile de dresser le tableau suivant :
xi = nombre de km² par
habitant
Fi (millions)
fi c(Xi)=zi xi Fi
(millions)
g(xi) G(xi)=yi
Asie 1/101 2777 0.5831 0.5831 27.4950 0.2043 0.2043
Europe 1/99 490 0.1029 0.6860 4.9494 0.0368 0.2411
Afrique 1/18 537 0.1128 0.7987 29.8333 0.2217 0.4628
Amérique 1/16 658 0.1382 0.9369 41.1250 0.3056 0.7684
gBrésil = 1.076-0.508=0.568
URSS 1/12 276 0.0580 0.9949 23.0000 0.1706 0.9393
Océanie 1/3 24.5 0.0051 1.000 8.1667 0.0607 1.0000
Total 4762.5 1.0000 134.5695
zj-1 yj zj yj-1
0.1406 0.1402
0.3175 0.1926
0.6137 0.4336
0.8800 0.7644
0.9949 0.9393
2.9467 2.4701 = 0.4766
La courbe de Lorenz est représentée ci-dessous. Elle nous donne une indication relative à la valeur de l'indice de Gini en 1984. En effet, l'indice de Gini n'exprime rien d'autre que le rapport de deux aires déterminées par la courbe de Lorenz : g = (aire OAC)/(aire OAB).
On peut donc comparer le degré d'inégalité dans la répartition de l'espace terrestre de 1970 avec celui de 1984. Ainsi, si en 1970, g = 0.2, il semblerait qu'en 1984, g ait une valeur supérieure, c'est-à-dire que la distribution est davantage concentrée et donc que la répartition de l'espace terrestre entre les différents continents et l'URSS est devenue plus inégalitaire.
Ceci est dû au fait que les pays ont connu des taux de croissance de leur population très différents.
Exercices supplémentaires
Afin de vous préparer aux mieux à l’examen ainsi qu’au test, voici les corrigés de deux exercices supplémentaires.
Exercice 3.4
a) Deux séries cumulées sont utilisées dans la construction de la courbe :
- celles des effectifs cumulés ou la fonction de répartition des fréquences (C(xj) ou c(xj) (en abscisse) ;
- celles des valeurs observées (xj.Fj), triées en ordre croissant de xj, cumulées exprimées en pourcentage du total à répartir (G(xj), cumul des g(xj)) (en ordonnée).
g(xj) = (xjFj)/Tot et Tot=xjFj + Carré de Gini (de 1 sur 1)
Distribution des revenus sans indemnisation des chômeurs xj Fj fj C(xj) c(xj)=zj xjFj g(xj) G(xj)=yj
0 9 0.1304 9 0.1304 0 0.0000 0.0000
1000 30 0.4348 39 0.5652 30000 0.3333 0.3333 2000 30 0.4348 69 1.0000 60000 0.6667 1.0000
Total
69 1.0000 90000
Calcul de l’indice de Gini
= (z j-1yj - yj-1z j)
zj-1 yj zj yj-1 zj-1yj - yj-1z j
0.0435 0.0000 0,0435 0.5652 0.3333 0,2319 0.6087 0.3333 =0.2754
Distribution des revenus avec indemnisation des chômeurs
Xj Fj fj C(xj) c(xj)=zj xjFj g(xj) G(xj)=yj
450 9 0.1304 9 0.1304 4050 0.0450 0.0450
955 30 0.4348 39 0.5652 28650 0.3183 0.3633
1910 30 0.4348 69 1.0000 57300 0.6367 1.0000
Total
69 90000
zj-1 yj zj yj-1 zj-1yj - yj-1z j
0.0474 0.0254 0.0217 0.5652 0.3633 0.2015 0.6126 0.3887 =0.2239
b) La représentation des courbes de Lorenz (cf. ci-dessus) indique clairement que l’assurance chômage induit une plus grande égalité dans la distribution des revenus. Cette impression graphique est confirmée par l’indice de Gini puisque g1g2.
L’assurance chômage a donc un effet redistributif certain.
.
Exercice 3.8
xj Fj fj C(xj) c(xj)=zj xjFj g(xj) G(xj)=yj
5.5586E-05 5.8E+08 0.2354 5.8E+08 0.2354 32406.8927 0.0210 0.0210 1.6681E-04 1.2E+09 0.4703 1.7E+09 0.7057 194328.6072 0.1260 0.1470 1.8051E-03 7.3E+08 0.2943 2.5E+09 1.0000 1315884.4765 0.8530 1.0000
Total 2.5E+09 1.0000 1542619.9764
Nous constatons que l’aire entre la diagonale et la courbe est assez importante par rapport au triangle, cela signifie que la distribution de la distribution de l’accès est très inégalitaire. Cela n’est pas surprenant étant donné que les pays à faible revenu ont un nombre de médecins négligeable par habitant en comparaison avec les pays industrialisés.
zj-1 yj zj yj-1 zj-1yj - yj-1z j
0.0346 0.0148 0.7057 0.1470
0.7403 0.1618 =0.5785
DEMARCHE A RETENIR DE CE TP ! ! !
Pour le calcul des terciles, quartiles, quintiles, déciles, percentiles,… adaptez correctement la formule (interpolation linéaire) de la médiane !!!
Pour le calcul des différents paramètres, il faut, avant tout, bien comprendre la signification des différents termes dans les différentes formules.
Pour le calcul de l’indice de Gini, la détermination d’un xj correct est LA clé de l’exercice.
La détermination des Fj et/ou fj correctes est aussi primordiale. Une fois les xj et les Fj et/ou fj déterminés, la technique de calcul pour arriver à l’indice de Gini est toujours la même !
Pour la courbe de Lorenz :
- l’inscrire dans un carré de Gini (de 1 sur 1) ;
- tracer la droite d’équirépartition afin de bien analyser la courbe de Lorenz par rapport à celle-ci ;
- donner un nom aux axes (en sachant que les zi sont placés en abscisse et les yi en ordonnée).
N’oubliez pas l’importance d’une interprétation correcte des paramètres, indices et graphiques !