R EVUE DE STATISTIQUE APPLIQUÉE
W ERNER H ILDENBRAND A LOIS K NEIP
K LAUS J. U TIKAL
Une analyse non paramétrique des distributions du revenu et des caractéristiques des ménages
Revue de statistique appliquée, tome 47, n
o3 (1999), p. 39-56
<http://www.numdam.org/item?id=RSA_1999__47_3_39_0>
© Société française de statistique, 1999, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
UNE ANALYSE NON PARAMÉTRIQUE
DES DISTRIBUTIONS DU REVENU
ET DES CARACTÉRISTIQUES DES MÉNAGES
Werner
Hildenbrand1,
AloisKneip2,
Klaus J.Utikal1 1 Département
d’Economie, Université de Bonn, Bonn,Allemagne
2Institut
deStatistique,
UniversitéCatholique
de Louvain, Louvain-la-Neuve,Belgique RÉSUMÉ
Nous étudions des familles de distributions bivariées du revenu et de
l’âge,
mais aussidu statut
professionnel
par l’intermédiaire de leurs densitésmarginales
et conditionnellessur
plusieurs
années. Un concept d’invariance est introduit afin de décrire l’évolution dans le temps de ces distributions. Une estimation nonparamétrique
est réalisée en utilisant des estimateurs fonctionnels à noyau obtenus en sélectionnant des fenêtresoptimales.
Les donnéesse composent d’échantillons en coupe transversale provenant de la
population
desménages britanniques
au cours des années 1968 à 1995.Mots-clés : estimation non
paramétrique
de la densité,fonctions
noyau, sélection defenêtre,
invariance, données en coupe transversale, distributions âge-revenu,enquête Family Expen-
diture
Survey.
ABSTRACT
We
study
families of bivariate distributions of income with age andoccupation
viatheir
marginal
and conditional densities over several years. A concept of invariance is introduced to describe the timechanging
nature of these distributions. Estimation is carried outnonparametrically using
kemel smoothers withoptimally
selected bandwidths. The data consists of cross sectionalsamples
from thepopulation
of Brithish households drawn over the years of 1968-1995.Keywords : nonparametric density
estimation, kernelfunctions,
bandwidth selection, inva- riance, cross sectional data, income-age distributions,Family Expenditure Survey.
1. Introduction
En
économie,
comme dans d’autreschamps d’application,
il est d’uneimpor-
tance
majeure d’analyser
la distribution du revenu et de variablessocio-économiques apparentées.
Le terme «variablesapparentées» désigne
descaractéristiques
de lapopulation,
telles quel’âge,
la taille de lafamille,
le statutprofessionnel,
etc...,qui
sont fortement corrélées au revenu et
qui jouent
un rôleimportant
dans de nombreux modèleséconomiques.
40 W HILDENBRAND, A. KNEIP, K.J. UTIKAL
Dans cet
article,
notre étudeporte principalement
sur l’étude du revenu et descaractéristiques
desménages (âge
etcatégorie sociale)
en GrandeBretagne.
Lesdonnées
proviennent
del’enquête Family Expenditure Survey (FES)
conduite aucours des années 1968 à 1995. Des
enquêtes
similaires ont été menées dans d’autres pays comme, parexemple, l’Enquête Budget
Famille en France(voir
section2);
ellespourraient
êtreanalysées
defaçon analogue.
Une littérature abondante traite des distributions du revenu.
Beaucoup
detravaux
théoriques
etappliqués partent
dupoint
de vue del’analyse
dubien-être, voir,
entre autres, Gottschalk etSmeeding (1997).
Ces travaux ont pourobjet
demesurer l’
«inégalité»
de la distribution du revenuparmi
despopulations
données.Une
approche
usuelle consiste à construire desparamètres spécifiques qui quantifient
le
degré d’inégalité,
comme lesquantiles
de la distribution du revenu, le coefficient deGini,
la courbe deLorentz,
voir Atkinson(1983).
Cesparamètres
sontcomparés
d’un pays à un autre et leur évolution dans le
temps
estétudiée. 1
Des variables telles que le revenu,
l’âge,
la taille de la famillejouent
aussi unrôle
important
enanalyse
de la demande. Elles influencent defaçon
déterminante lebudget domestique
des biens de consommation(tels
que lesproduits alimentaires,
lescarburants,
lestransports,
lesservices, etc...).
Cequ’on apelle «systèmes
dedemande»,
voir entre autres Deaton et Muellbauer(1980)
ou Blundell et al.(1993),
modélisent la consommation d’un
foyer particulier
comme une fonction de cesvariables et des
prix.
Unproblème important
en macroéconomie consiste à modéliser l’évolutiontemporelle
de la consommation moyenne de lapopulation.
Pour modéliserla consommation moyenne, on utilise de
façon
usuelle les modèlesautorégressifs
basés sur le revenu moyen, voir Deaton
( 1992).
D’autrepart,
il est clair que les modi- fications de la consommation moyennedépendent généralement
des modifications de la distribution toute entière du revenu.Supposer
que cette distribution ne rentre dansl’analyse
que par l’intermédiaire de sa moyenne est une démarchesimplificatrice.
Enfait,
dans la littératureéconomique,
on note une controverse ausujet
de l’influence additionnelle quepourraient
avoir des effets de distribution commel’«inégalité
croissante» du revenu. Hildenbrand et
Kneip (1999) proposent
uneapproche générale
pour modéliser l’influence des distributions du revenu et des
caractéristiques
de lapopulation
sur la consommationlorsque
ces distributions évoluent dans letemps.
L’idée fondamentale consiste à chercher des invariances dans le
temps
de telles distributions.L’exemple
suivant en donne une illustration. Soitfl, f2,...
les densités du revenu en différentes années t =1, 2,....
Engénéral, lorsque
les distributions évoluent dans letemps
etqu’elles
ne rentrent dansl’analyse
que par l’intermédiaire de leur moyenne, on n’obtient des résultats corrects que si l’on a l’invariance des distributions du revenu relatif :pour les années
t, s
où xt désigne
le revenu moyen de l’année t.Alors,
les évolutions des distributions du revenu sontcomplètement paramétrisées
par leurmoyenne xt puisque
la densitédu revenu relatif
xtlx-t
nechange
pas dans letemps.
1 Dans ces travaux, on s’intéresse d’habitude à l’analyse du revenu «individuel». En règle générale, un
tel revenu individuel est établi à partir du revenu des ménages en utilisant ce qu’on appelle des échelles
d’équivalence. Dans cet article, nous n’adoptons pas cette approche.
La notion d’invariance introduite ci-dessus nous amène à poser une condition
spécifique
sur l’évolution des densités du revenu dans letemps.
Nous montreronsplus
loin que cette transformation
simple peut déjà apporter
unepremière approximation raisonnable,
et que l’onpeut
améliorer l’invariance en utilisant d’autres transforma- tionsplus générales
du revenu aussi bien que d’autres variables concommitantes. Engénéral,
la recherche de l’invariance des densités transformées defaçon appropriée peut
se résumer par l’énoncé suivant : étant donnés des échantillons annuels d’obser- vations, trouver unefamille
detransformations simples qui
conduisent à unefamille
de densités évoluant très peu dans le temps. Une transformation
simple
satisfait leprincipe
deparcimonie
si elledépend
seulement de peu deparamètres qui peuvent
évoluer dans letemps.
L’idéal serait que cesparamètres puissent s’interpréter
faci-lement
(comme
la moyenne ou la variance de la distribution durevenu).
Deplus,
leur
interprétation pourrait
se révélerpertinente
dansl’analyse
desprédictions
detransformations futures
(donc
des densités futures durevenu)
àpartir
dupassé.
Avant de
pouvoir
chercher des transformations des densités du revenu, leproblème qui
se pose à nous est celui de l’estimation de la densité. Il s’avère que l’on nepeut
pas considérer ces densités comme une formeparamétrique simple
sauf pour des sous-groupesparticuliers
de lapopulation.
Elles doivent alors être estimées defaçon
non
paramétrique.
La littérature dans le domaine de l’estimation nonparamétrique
dela densité est
abondante,
etplusieurs
méthodes différentes ont étédéveloppées,
voirSilverman
(1986).
La méthode laplus largement
admise et laplus simple
à concevoir est la méthode de l’estimation à noyau de la densité. Deplus, d’après
notreexpérience (et
onpeut
aussi le démontrermathématiquement), lorsque
les échantillons sont de tailleélevée,
les estimations sontproches
les unes des autres bien que les estimateurs soient dérivés de méthodes nonparamétriques
différentes. Nousdisposons
de telséchantillons que nous
analysons plus
loin aux sections 4 et 5. Unedescription
desdonnées se trouve à la section 2.
Dans le cadre de l’estimation des distributions du revenu, des
aspects techniques importants
de l’utilisation des estimateurs à noyau ontdéjà
été discutés dans Wand et al.(1991)
ainsi que dans Schmitz et Marron(1992).
Notreapproche méthodologique
décrite à la section 3 se base sur ces travaux, mais il sedistingue
parune meilleur
procédure
pour choisir leparamètre
delissage.
Les transformations examinées aux sections 4 et 5 sont basées sur des méthodes
simples,
comme la standardisation ou encore la transformationlogarithmique.
Laperformance
des transformations estgénéralement
améliorée enpartitionnant
lapopulation
en sous-groupes. Dansplusieurs
cas, onpeut argumenter,
que, de cettemanière,
l’invariance estdéjà
atteinte defaçon satisfaisante,
alors que pour d’autres variables telles que le revenu, l’utilisation de transformations resteindispensable.
Dans cet
article,
il restequelques points
à éclairer par les recherches àvenir,
tels que leproblème
de laprédiction
des densités futures et l’élaboration de méthodesplus générales
pour trouver une transformationappropriée.
Nous nous référons à un article deKneip
et Utikal(1999)
pour une solutionmathématique
de ceproblème,
basée surl’analyse
semiparamétrique
d’une famillegénérale
de transformations d’échelle. Lesimplications économiques
de ces résultats restentjusqu’à
cejour inexplorées.
42 W. HILDENBRAND, A. KNEIP, K.J. UTIKAL
2. Les Données
Dans les sections
suivantes,
lesanalyses
sont conduites sur la base des donnéesprovenant
del’enquête britannique Family Expenditure Survey (FES).
Cetteenquête
est effectuéechaque
annéedepuis 1957,
à l’initiative du gouvernementbritannique. Chaque année,
environ 7000ménages,
cequi
revient à 0.5 % desménages britanniques,
notent leursdépenses
concernant unegrande
variété de biens deconsommation,
comme lepain,
différentes sortes deviande,
parexemple.
Un«ménage»
est définiglobalement
comme un groupe de personnes vivant sous le même toit etqui partagent
au moins un repas commun. Les informations sont recueillies au moyen d’entretiens avec les membres dufoyer,
mais aussi àpartir d’«agendas»
danslesquels
les personnesinterrogées
ont noté toutes leursdépenses
sur une
période
dequatorze jours.
Le taux deréponses
se situe autour de 68 % detous les
ménages
sélectionnés et variechaque
année. Dans cetteenquête,
se trouventégalement
des informations sur les différentes formes du revenu ainsi que sur d’autrescaractéristiques
desménages.
Afin de définirprécisément
lesvariables,
les unitésexpérimentales,
les modèlesd’échantillonage,
le travaild’enquête,
la confidentialité et la fiabilité del’information,
entre autres, nous nous référons au manuel del’enquête
FES
publié
annuellement comme àl’ouvrage
deKemsley
etal., Family Survey
Handbook
(1980).
Dans cette
étude,
nous utilisons des informations sur le revenu desménages
ainsique sur
l’âge
et le statutprofessionnel
du chef deménage.
Ondésigne
par «chef deménage» l’époux
d’uncouple marié;
dans tous les autres cas, ils’agit principalement
de la personne
qui possède
ouqui
loue le lieu de résidence. Nousdisposons
de lavariable de revenu net, c’est-à-dire du revenu
disponible
hebdomadaire desménages,
ce
qui
revient essentiellement au revenu brut minoré des taxes et descharges
deSécurité Sociale. Notons
cependant,
que les cotisations retraite n’ont pas été déduites du revenu brut.Des
enquêtes
similaires ont été menées dans d’autres pays, comme le CEX(Etats-Unis),
EPF(Espagne),
EBF(France).
Toutes cesenquêtes
sont dites en coupe transversale(
c’est-à-direqu’elles portent
sur différentsménages
à différentesannées).
Elles sont considérablement différentes des
enquêtes
depanel,
danslesquelles
unecohorte de
ménages
est étudiée sur unepériode donnée,
comme cela adéjà
été faitdans le PSID
(Etats-Unis)
et le GSEP(Allemagne).
Le lecteur
néophyte
doit être avertiqu’aucune
conclusion nepeut
être tirée àpartir
des données sans examiner attentivement lasignification précise
des variables observées. Il estparticulièrement important
degarder
en mémoire que les définitionschangent
un peu avec letemps,
comme c’est le cas dans notre étude. Ceproblème
sera illustré dans la section suivante.
3. Les méthodes
statistiques
La méthode de
l’histogramme (c’est-à-dire
lediagramme
desfréquences)
constitue un outil utile pour estimer des densités. Elle est aussi facile à calculer que
simple
àcomprendre
et àexpliquer. Cependant,
elleprésente
aussi des inconvénients certains. Entre autres, il est clairqu’une
densité continue nepeut
raisonnablementêtre estimée par une fonction discontinue. Par
ailleurs,
il serait peupertinent
d’étudierdes densités variables dans le
temps
enreprésentant plusieurs histogrammes
sur lemême
graphique.
Plusieurs méthodes ont été élaborées pour surmonter les défauts deshistogrammes
et pourproduire
des estimateursplus précis,
voir Silverman(1986).
Nous utiliserons
uniquement
les estimateurs à noyau de la densité. Des résultatsthéoriques
ont étépleinement développés
et deslogiciels
de calcul sont facilementaccessibles. On
peut
montrer aussi que leshistogrammes
sont un casparticulier
deces estimateurs à noyau.
Etant données n observations
Xl’...’ Xn
d’une variable aléatoireX,
un estimateur nonparamétrique
bien connu de sa densitéf (x)
est l’estimateur à noyauoù K est une fonction noyau
déterminée, qui
satisfait aux conditions suivantes : K est une fonction nonnégative
et dontl’intégrale
estégale
à 1. Parexemple,
nous utilisonsdans nos
analyses
le noyaugaussien
Nous ferons par la suite des commentaires
plus approfondis
sur le choix du noyau et duparamètre
delissage
h(encore appelé fenêtre).
Notons que pour x = Xl, X2, ... où Xi+1 -Xi = h et pour un noyauK(x)
=l/h
pour-h/2
xh/2
etzéro
ailleurs,
nous retrouvonsl’histogramme
si l’on calculef (xi)
au moyen de(3.1 )
et définissons
f (x)
=Î(xi)
pour tout autre x tel que xi -h/2
x xi +h/2.
Ilest bien connu que, pour de
grands échantillons,
cet estimateur estasymptotiquement
non biaisé et normalement
distribué,
de varianceoù
L’erreur
quadratique
moyenne(mse) approchée
def ( x ) s’exprime
comme lasomme de la variance et du biais au
carré,
où
(Notons
que pour le noyaugaussien
44 W. HILDENBRAND, A. KNEIP, K. J. UTIKAL
En
règle générale,
il est établi que l’estimation est peu sensible au choix du noyau, sauf pour despropriétés
decontinuité,
alors que la fenêtrejoue
un rôle crucial.Plusieurs méthodes de sélection de fenêtre ont été mises au
point,
voir Simonoff( 1996).
Dans lesanalyses
menées en section4,
nous utilisons le critère de minimisation de l’erreurquadratique
moyenneintégrée MISE = 1 mse(Î(x»
dx. La fenêtreoptimale hopt
doit alors satisfairePour résoudre cette
équation,
nous avons besoin d’estimer la dérivée de la densité inconnuef",
cequi requiert
de choisir un secondparamètre
delissage.
Par
conséquent,
la fenêtre obtenuehopt
est seulement une estimation dehopt.
Uneapproximation simple,
décrite par Silverman(1986),
consiste àremplacer
dans(3.5)
la fonction inconnue
fez
par la dérivée seconde d’uneapproximation
de la densité inconnuef.
Cette méthode nousparaît
fort utile pour donner unepremière
idée de lalargeur
de la fenêtrelorsque
des densitéssymétriques
en forme de cloche doivent être estimées. Dans uneapproche plus générale,
on se propose despécifier
ladépendance
par
rapport
àhopt
duparamètre
delissage
dans l’estimation defez
et ensuite derésoudre itérativement
l’équation
consécutive.Engel et
al.(1994)
ont montré quel’algorithme proposé (et
que nous utilisonsaussi)
estconvergent.
Deplus,
la solutionhopt
estasymptotiquement convergente
vers la solutionhopt
de(3.5) lorsque
lataille de l’échantillon croît. En
effet,
la convergencede hopt - hoPt 1/ hopt
vers 0est d’ordre
stochastique n-1 /2,
cequi
est assezrapide2 .
De l’estimateur obtenu avec cette fenêtreoptimale estimée,
on déduit une erreurquadratique
moyenne estimée d’ordreOp(n-4/5)3 .
Onpeut espérer
que cet estimateur soit d’unegrande précision
pour des échantillons de taille modérément
grande.
Notre
approche
pour estimer des densités du revenu consistecependant
en unelégère
modification de cetteprocédure générale.
Pour étudier les densités sur unepériode
deplusieurs années,
nous effectuons des transformationslogarithmiques
durevenu, et nous nous concentrons tout d’abord sur l’estimation des densités
fYt
dulog
revenu
y(x)
=log(x).
Les fenêtresoptimales
sont calculéesséparément
pourchaque
année t =
1, 2,.... Ensuite,
nous estimons les différentes densitésfYt
en utilisantcomme fenêtre la moyenne de toutes ces fenêtres
optimales.
Surchaque graphique,
les fenêtres moyennes sont notées en
légende.
Onpeut
les utiliser pour évaluer la variabilité desestimateurs,
ens’appuyant
sur la formule(3.3).
Comme dernière
étape,
ces estimations desfYt
sont utilisées pour construire des estimations des densitésoriginales ft
du revenu. Ceci se fait par unesimple
2 Schmitz et Marron (1992) sélectionnent la fenêtre de lissage par la méthode de validation croisée qui
a seulement une convergence d’ordre
stochastique n-1 / 10 .
Wand et al. (1991) utilise une procédure3 purement approximative.
3 Soit
t Zn 1 n C- N
une séquence de variables aléatoires réelles. On dit que Zn =Op(n-03B3), 03B3
0, sipour chaque E > 0 il existe un M > 0 tel que
P( n’"Y 1 Zn
>M)
E pour chaque n suffisammentgrand.
transformation selon la formule suivante :
Il n’est pas difficile de voir que cette
procédure équivaut
à estimer les densitésf t
du revenu(non transformé)
enemployant
un noyau de fenêtre variable x h au lieu d’une fenêtre fixe h. Cette méthodeemployée
pour transformer les données a été discutée dans Wand et al.( 1991 ).
Si l’on nel’emploie
pas, la structure desdensités,
pour les tranches des très faibles revenus,risque
d’être malreproduite (voir
Wandet al., 1991).
Pour illustrer cette
méthode,
considérons le revenu relatif desménages
observéen 1984. Un
histogramme classique
de ces données estreprésenté
enfigure
3.1[à gauche].
Une estimation à noyau de la densité[à droite]
obtenue avec une fenêtre de0.3 montre une courbe estimée
ayant
en gros la même allure.FIGURE 3.1
Histogramme (15 classes)
et estimateur à noyau de la densité(fenêtre
=0.3).
Un estimateur à noyau de la
densité,
obtenu avec la fenêtreoptimale (0.08)
aboutit à une forme
différente,
voirfigure
3.2[à gauche].
Unesingularité importante apparaît
pour des niveaux de revenus très faibles. Enreprenant
les mêmesdonnées,
un
histogramme,
réalisé avec unepartition
en classes trèsfines,
révèle l’existence deplusieurs
centaines deménages ayant
de très faibles revenus(voir figure
3.2[à droite]).
En outre, nous observons que cette
particularité
resteprésente chaque
annéepostérieure
à1984,
alorsqu’elle n’apparaît
pas les annéesprécédentes,
voirfigure
3.3.Une
explication peut
en être la suivante. Dès1984,
la définition du revenu net a été modifiée : les allocationslogement
ne rentrentplus
encompte
dans le calcul durevenu net. Par
conséquent,
nous limiterons notreanalyse
aux données du revenu antérieures à1984,
cequi
nouspermettra
d’illustrer ces méthodes tout aussi bien.De
plus,
onpeut espérer
que certains sous-groupes de lapopulation,
tels que celui des personnesemployées
àtemps plein,
seront peu affectés par cechangement
à46 W HILDENBRAND, A. KNEIP, K.J. UTIKAL
FIGURE 3.2
Estimateur à noyau de la densité
là gauche] fenêtre
= 0.3(trait plein) et fenêtre optimale
= 0.08(ligne brisée).
Histogramme
obtenu avec unepartition en fines
classeslà droite].
FIGURE 3.3
Estimateur à noyau de la densité
là gauche] fenêtre
= 0.3(trait plein) et fenêtre optimale
= 0.09(ligne brisée).
Histogramme
avec unepartition en fines
classeslà droite].
l’extrêmité inférieure de l’échelle des revenus. C’est la raison pour
laquelle
nousavons étendu
l’analyse
de ce groupe à l’ensemble de l’intervalle detemps.
Nous insistons à nouveau sur le fait suivant : un choix «intuitif» de la
fenêtre,
conduisant à des estimations«crédibles»,
aurait abouti à masquer cettesingularité importante
des données. La méthode de sélectionoptimale
de la fenêtre a le mérite de rendre l’ estimateur sensible à cetype
decaractéristique.
Nous terminons cette section en mentionnant brièvement le
problème
del’estimation d’une densité multivariée. Une bonne introduction à ce
sujet
se trouvedans la
monographie
de Scott(1992).
Defaçon
similaire à(3.1 ),
onpeut définir,
pourun échantillon bivarié
(Xl, Vi),..., (Xn, Yn)
l’estimateur à noyauoù
K12
est une fonction bivariée nonnégative, d’intégrale égale
à 1. Parcommodité,
nous considérons cette fonction comme le
produit
de deux noyauxgaussiens univariés,
c’est-à-direoù K est définie en
(3.2).
Defaçon analogue
au casunivarié,
l’erreurquadratique
moyenne, le choix de la matrice fenêtre etc... ont été étudiés dans le cas multivarié.
En outre, de nouveaux
problèmes
sont apparus dans ce domaine intéressant encore enplein développement;
pour une liste actuelle deréférences,
voir entre autres Simonoff( 1996).
4. La distribution du revenu des
ménages
Les données décrites en section 2 constituent des échantillons en coupe trans- versale du revenu des
ménages
sur unepériode
de 28 années. Les échantillons sont de tailleimportante, comprenant
environ 7000ménages chaque
année. Etant donnés degrands échantillons,
onpeut espérer
que les estimations à noyau des densités durevenu soient très
précises.
On
peut
visualiser par lafigure
4.1 les densités estimées du revenu net hebdomadaire(en livres)
pour les années1968, 1973,
1978 et 1983.Puisque
le revenu(nominal) augmente régulièrement
dans letemps,
il n’est passurprenant
de constater que les densités estiméeschangent beaucoup
dans letemps.
Il semble naturel de considérer le revenu relatif
plutôt
que le revenunominal;
le revenu relatif s’obtient en divisant le revenu nominal de
chaque ménage
par la moyenne de lapopulation.
Les densités du revenu relatif sont alorscomparables
surune échelle commune des
multiples
du revenu moyen, voirfigure
4.2.On
s’aperçoit
que seulement très peu deménages
ont un revenu extrêmement faible et l’on nepeut
tirer de conclusions claires concernant lemajorant
des hautsrevenus, pour
lesquels
les queues de distribution décroissent assez lentement. Notons que, pour des raisons deprésentation,
les densités ont étéreprésentées
pour des revenus allant seulementjusqu’à
trois fois le revenu moyen.La structure multimodale de ces densités
pourrait s’expliquer
comme étantle résultat d’une
superposition
de densités unimodales caractérisant des sous-populations
influentes. C’est ce quesuggèrent
lesfigures
4.3 et 4.4qui
montrentles estimations des densités du revenu relatif des chefs de famille
employés
àtemps plein
et de ceux sansemploi.
Notons que, pourchaque
sous-groupe, le revenu relatifse réfère au revenu normalisé par le revenu moyen de la
sous-population
correspon- dante. Les densités obtenues sont à peuprès unimodales,
et leur mode se situe en des48 W HILDENBRAND, A. KNEIP, K.J. UTIKAL
points
trèsdifférents 4.
Les modescorrespondants
de la densité du revenu relatif de lapopulation
totale(figure 4.2) apparaissent
clairement.Lorsque
nous avons considéré l’évolution des densités du revenu dans letemps,
nous avons
déjà remarqué plus
haut que la distribution du revenu nominal se modifiaitrapidement
dans letemps.
La transformation du revenu nominal en un revenu relatif conduit à des distributionsbeaucoup plus
«invariantes».Néanmoins,
ce caractère d’invariance est loin d’êtreparfait.
Un examen minutieux de lafigure
4.2 metquand
même en évidence une tendance dans l’évolution
temporelle
de ces densités du revenurelatif : le nombre de
ménages
à faibles revenus est enaugmentation,
alors que la hauteur dupic
de classe moyenne,qui
se situe autour du revenu moyen, décroît avec letemps.
Cesujet
adavantage
étéapprofondi
dansKneip
et Utikal(1999).
Unestratification en
sous-populations appropriées peut
déboucher sur des densitésplus
stables dans le
temps
comme onpeut
le voir sur lesfigures
4.3 et 4.4. Enparticulier,
lesdensités relatives aux chefs de famille
employés
àtemps plein
sontplus
invariantes dans letemps
que celles relatives à lapopulation
totale. Enfait,
unepartie
de latendance
temporelle
caractérisant ces dernièrespeut s’expliquer simplement
par la croissance de lapopulation
de tels sous-groupes; il est bien connu que lepourcentage
de personnesemployées
à tempsplein
décroîtrégulièrement
auRoyaume-Uni
alorsque celui des personnes sans
emploi
a sans cesseaugmenté jusqu’à
ces dernierstemps.
FIGURE 4.1 FIGURE 4.2
Population
totale :Population
totale :densités du revenu nominal. densités du revenu
relatif (0.079)5.
On
pourrait
essayer d’éliminer les différencesqui
restentprésentes
entre lesdensités en
figures
4.2-4.4 enappliquant
des transformationsplus sophistiquées.
4 En section 2, nous avons déjà signalé une modification apparue en 1984 de la définition du revenu. Cette modification n’affecte pas la population des personnes employées à temps plein. Pour cette raison, seuls les revenus de ce dernier groupe ont été étudiés à partir de 1983.
5 Les fenêtres moyennes optimales utilisées pour le lissage du log revenu
y(x)
=log(x)
sont donnéesentre parenthèses
( ).
FIGURE 4.3
Employés
à tempsplein :
densités du revenu
relatif (0.084).
FIGURE 4.4 Sans
emploi :
densités du revenu
relatif (0.089).
Celles-ci
incorporent
des moments d’ordreplus
élevé ainsi que nous le ferons par la suite. SoitXit
le revenu nominal d’unménage
individueli,
définissons lelog
revenu standardisé
Zit
paroù tct et
et désignent
la moyenne et la variance delog(Xit)
dans lapopulation.
Siles distributions
sous-jacentes
étaient exactement normalesalors,
pour toute année t, la densité obtenuef t
deZit générée
par cette transformation serait une normale standard.Donc,
sous cettehypothèse,
les densitésf t , fit*+ 1, ...
seraientcomplètement
invariantes dans le
temps.
Notons toutefoisqu’il
n’est pas nécessaire d’avoir lalog-
normalité pour obtenir l’invariance
temporelle.
Enfait,
assezgénéralement,
il sembleraisonnable
d’espérer
que l’invariancetemporelle
s’amélioreaprès
avoirappliqué
cette transformation : elle élimine les différences en localisation et en
dispersion
entre les distributions. Par
exemple,
il est bien connu que les variances dulog-revenu
relatif
augmentent
dans letemps.
La standardisation élimine donc cet effet.Les
figures
4.5 et 4.6 montrent les densités estiméesf t
dulog-revenu
standar-disé pour la
population
totale et pour le sous-groupe des personnesemployées
àtemps plein.
Commerésultat,
il semble que les densités des personnesemployées
àtemps plein
soient defaçon
très satisfaisante invariantes dans letemps.
Enprincipe,
celapeut
êtretesté,
bien que cela n’ait pas encore été fait par les auteurs. Cettehypothèse
estd’un intérêt certain
puisque
l’étude de l’évolution de la densité du revenu se réduirait alors entièrement à une étude de l’évolution desparamètres
03BCt et Ut.Manifestement,
les densités dulog-revenu
standardisé de lapopulation
totalene sont pas exactement
invariantes,
mais il semblequ’elles gagnent
en stabilitécomparées
aux densités du revenu relatif.50 W HILDENBRAND, A. KNEIP, K.J. UTIKAL
FIGURE 4.5
Population
totale :densités du
log-revenu
standardisé(0.127)
FIGURE 4.6
Employés
à tempsplein :
densités du
log-revenu
standardisé(0.188)
5. Les distributions
conjointes
du revenu et descaractéristiques
desménages
Dans la section
précédente,
nous avons vuqu’une
stratification par le statutprofessionnel
aboutit à des densités du revenu dont la structure estplus simple.
Engénéral,
d’unpoint
de vueéconomique, l’analyse conjointe
du revenu et d’autrescaractéristiques
desménages (tels
quel’âge,
la taille duménage,
entreautres)
est d’un intérêt considérable. Cette démarche estparticulièrement importante
enanalyse
de la demande. La consommation et
l’épargne dépendent
du revenu aussi bien que descaractéristiques
desménages.
Dans la littératureéconomique, l’âge
est souvent considéré comme laplus importante
descovariables,
voir Deaton(1992).
Par la
suite,
nous concentrons donc notre attention sur la distributionconjointe
de
l’âge
et du revenu. Dansl’enquête FES,
la variable« âge »
se réfère à l’« âge
du chefde famille». Par
conséquent,
la distribution del’âge correspondante
nereprésente
pasla distribution de
l’âge
de tous les individus en GrandeBretagne.
De touteévidence,
très peu chefs deménage
sontâgés
de moins de 20 ans.Dans la section
précédente,
nous avonsanalysé
en détail la distributionmarginale
du revenu. Onpeut
à nouveau utiliser des estimateurs à noyau de la densité pour étudier la distributionmarginale
del’âge.
Lafigure
5.1 montre les densités estimées del’âge
pour les années 1968-1971 et 1980-1983. Onpeut
constaterqu’il
y a réellement peu de
ménages
dont le chef de famille estjeune
ou trèsâgé.
Lesdensités sont élevées dans un intervalle allant de 25 à 70 ans. Les détails structuraux sont
plutôt irréguliers
et peu aisés àinterpréter.
Enfait,
les fenêtresoptimales
estiméessont très
petites.
Ceci seprésente
commeconséquence
du faitqu’une petite
fenêtreest
indispensable
pour une modélisationadéquate
de la croissancerapide
des densitésaprès
20 ans ainsi que de la décroissancerapide
autour de 70 ans. Des estimationsplus
stables
pourraient
être obtenues par un choixadaptif
local desfenêtres,
en utilisant des fenêtresplus larges
dans larégion
entre 30 et 70 ans.Nous nous intéressons
principalement
à lacomparaison
des densités del’âge
dans le
temps.
Iln’y
a pas eu d’évolutionapparente
au cours de l’une ou l’autre deces deux
périodes
dequatre
ans. Outre des fluctuationsmineures,
il s’avère que les densités del’âge
entre 1968 et 1971 sont fort semblables les unes aux autres. Onpeut
faire la même observation pour les densités entre 1980 et1983,
ou toute autrepériode
de
quatre
années consécutives.Cependant,
une différencefrappante distingue
ces deuxfamilles de densités sur la
figure
5.1correspondant
l’une au début des années soixante- dix et l’autre au début des annéesquatre-vingt.
Unpic
caractérisant les«jeunes ménages» émerge
au cours des annéesquatre-vingt, phénomène qui n’apparaît
pas dans les annéessoixante-dix,
cequi indique
donc unchangement socio-économique
à
long
terme.FIGURE 5.1
Population
totale : densités del’âge (1.84) [à gaucheJ, (1. 91 ) [à droiteJ.
Rappelons
la discussion menée en section 4 ausujet
des invariancestempo-
relles. Nous avons vu que les densités du revenu nominal se modifientrapidement
d’une année à l’autre. Ce n’est
qu’après
avoirappliqué
des transformations appro-priées
que nouspouvions parler
d’une invarianceapproximative
des densités du revenutransformé. La situation est clairement différente en ce
qui
concerne la distributionmarginale
del’âge.
Il n’est ni nécessaire ni réalisable de chercher de telles transfor- mations. Les densités del’âge
évoluent très peu d’une année àl’autre,
elles sont, à court terme, à peuprès
invariantes dans letemps.
Les modifications des densités del’âge
doivent êtreprises
encompte
dans le seul cas où l’on s’intéresseprincipalement
à une
analyse
delong
terme.Revenons maintenant à l’étude de la distribution
conjointe
del’âge
et du revenu.Considérer la distribution
conjointe
del’âge
et du revenu nominal n’a pas de sens. Il estclair,
auregard
de la distributionmarginale
du revenunominal,
que cette distribution évoluerarapidement
dans letemps. Cependant,
consécutivement à notre discussionsur les densités
marginales,
nous avonsquelques espoirs
de trouver desrégularités
dans la densité
conjointe
del’âge
et dulog-revenu
standardisé. Lafigure
5.2 montreles estimations à noyau en deux dimensions de cette densité
conjointe
pour deux années distinctes.Les deux densités semblent être similaires dans une certaine mesure. Comme tendance
globale,
on reconnaît que, pour chacune de ces deuxannées,
lesménages
très52 W HILDENBRAND, A. KNEIP, K.J. UTIKAL
FIGURE 5.2
Population
totale : Densitéconjointe
dulog-revenu
standardisé et del’âge.
jeunes
ainsi que lesménages
trèsâgés
ont des revenusplus
faibles que lesménages ayant
atteint lacinquantaine.
Lagrande majorité
desménages
à faibles revenus ontplus
de 60 ans.Cependant,
lesjeunes ménages
dont les revenus sont très faibles formentégalement
un groupeimportant.
Ilapparaît
que laplupart
desménages
de laclasse moyenne et de la classe moyenne
supérieure
sontâgés
d’environ 50 ans. On trouve, defaçon
assezsurprenante,
peu deménages
à hauts revenusayant plus
de70 ans.
Une connaissance
plus approfondie
de l’évolutiontemporelle
de cesparticu-
larités
peut
êtreacquise
enanalysant
les densités del’âge
stratifié par classes derevenus. Nous utilisons
quatre
classes de revenus que l’on détermine par leurposition
dans la densité du
log-revenu
standardisé(noté x):-2x-1 (faibles revenus);
-1 x 0 (classe
moyenneinférieure); 0 x
1(classe
moyennesupérieure);
1 x
2(hauts revenus).
La
figure
5.3représente
les distributions del’âge
au cours des années 1968-1972,
obtenues pourquatre
classes de revenus. Nous remarquons très vite que les distributions del’âge
sont très différentes pour des classes de revenus distinctes. Plusprécisément,
comme nous l’avonsdéjà
vuplus
haut pour la densitébivariée,
laplupart
des
ménages
à faibles revenus sontâgés
d’environ 70 ans. La distribution bimodale de la classe moyenne inférieure se concentre autour de 30 et 70 ans. Le groupe desménages
à hauts revenusprésente
une distribution unimodale concentrée autour de 50 ans.La
figure
5.3 montreégalement
que, à l’intérieur dechaque
groupe, les densités stratifiées évoluent très peu de 1968 à 1972. On obtient ce même résultat pour d’autrespériodes
decinq
années consécutives. C’est ce que l’onpeut voir,
parexemple
enfigure 5.5, qui
montre les densités del’âge
desménages
à faibles revenus au cours des années 1991-1995. D’autrepart,
les évolutions àlong
terme des densités stratifiées sontconsidérables,
lesplus prononcées apparaissant
pour le groupe desménages
àfaibles revenus. C’est ce que montre la
figure
5.4qui représente
l’évolution obtenueau cours des années 1968 à 1995. On détecte clairement
l’apparition
d’un sous-groupe desjeunes ménages
à faibles revenus. Nous devrions noter que cephénomène
socio-FIGURE 5.3
Population
totale : densités del’âge,
pour six annéesconsécutives, stratifiées
en classes de revenus;les fenêtres optimales
moyennessont
présentées
entreparenthèses.
économique explique
enpartie l’augmentation
du«pic
caractérisant lesménages
àfaibles revenus » dans la distribution du revenu. En
résumé,
defaçon
similaire à notre discussion sur la distributionmarginale
del’âge,
nous pouvons tirer les conclusionsqualitatives
suivantes ausujet
de l’évolutiontemporelle
de la distributionconjointe
de
l’âge
et dulog-revenu
standardisé :a)
Les distributions stratifiées del’âge
évoluent très lentement d’une année àl’autre,
elles sont à court termeapproximativement
invariantes dans le temps.b)
Along
terme, une tendanceapparaît
clairement pour le groupe desménages
à faibles revenus. Cette tendance doit être
prise
encompte
dans uneanalyse
delong
terme.
c)
Les distributions del’âge présentent
des différences radicales d’une classe derevenus à une autre. Ces différences sont