R EVUE DE STATISTIQUE APPLIQUÉE
P. T HIONET
Ébauche d’une théorie statistique des agrégats
Revue de statistique appliquée, tome 8, n
o3 (1960), p. 107-111
<
http://www.numdam.org/item?id=RSA_1960__8_3_107_0>
© Société française de statistique, 1960, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
ÉBAUCHE D’UNE THÉORIE STATISTIQUE DES AGREGATS
P. THIONET
Administrateur
àl’Institut National
de laStatistique
etdes Études Économiques
I - INTRODUCTION -
D’un usage courant en
comptabilité
Nationale le mot"agrégat"
n’estjamais employé
en théoriestatistique.
D’autrepart
les"problèmes d’agrégation"
sontabsents des traités et manuels de
statistique,
mais sont étudiés eh économétrie.Cette division du travail est un état de
fait, plus
ou moins rationnel.La
méthodologie statistique
traite des moyennes. Si unepopulation,
d’effec-tif
N,
a relativement à la variable x, une moyenneX, l’agrégat
est Nx c’est-à- dire E x. On s’intéressera soit àx,
soità E x,
suivant le domained’applications
considéré.
Considérons à
présent
des variables ou caractères x y z ....prenant
surchaque
unitéstatistique (i)
les valeursxi , y~ , z ~,
...., 1 leursagrégats
pour l’en- semble de lapopulation
serontdésignés
parX, Y, Z,
... Il est utile de savoir siY, Z,...
nepeuvent
pass’exprimer,
au moyen de X comme variableet,
sinontoujours
sous forme de fonctions :Y =
f(X) ,
Z =g(X),
....du moins avec des variables aléatoires
Y)( qu’on négligera
enpremière approxi-
mation pour une
population
suffisammentnombreuse,
Y f(X) + 71
1Z = g( X) + ç
...étant entendu que
f,
g, .. nedépendent
que de X = E x et non des autres carac-téristiques
de la distribution des xi. Ceci constitue unproblème d’agrégation
enstatistique.
En
supposant
que les(i)
sont desménages
de revenus xi’ onpeut
voir dansy. , z.,
.... certains groupes dedépenses
desménages, quand
on suppose cons- tants lesprix
p, q, ... C’est alors unproblème d’économétrie ;
il a été traitépar Gorman (Econometrica -
Janvier1953)
et Nataf(Thèse 1953) quand
on s’abs-tient d’utiliser des aléatoires
11 ,ç
..Nous nous proposons de traiter directement le
problème
enstatistique.
Nous ferons l’économie de la théorie des
choix,
des surfacesd’indifférence,
descourbes
d’Engel, etc. ,
et nous suivrons unprocédé purement géométrique.
Ils’agit
d’un essai pourrapprocher mathématiciens,
Jstatisticiens,
J économistes(1).
---
(1) Le problème a été traité aussi sous l’angle de l’économétrie par R. G. D. Allen, Mathema- tical Economics, chapitre 20 (The aggregation problem) - Londres 1957.
II - PROBLEMES D’AGREGATION : LES BESOINS -
Empruntons
à l’économétrie les notions de microrelation et de macrore-lation
etdistinguons
les relations suivant que letemps
t entre ou non enligne de compte.
Les conditions réellespeuvent
être les suivantes :II. 1 - Ou bien le statisticien
possède
les sériesstatistiques (disons
annuel-les)
desagrégats :
et il constate que les
points (Xt Yt Zt)
ont tendance à seplacer
sur une certainecourbe
simple ;
le nombre n de cespoints
n’estjamais
trèsgrand
enpratique .
Par ailleurs les données individuelles
(x it’
y; t ,Zit’..)
fontdéfaut ;
et c’est àpartir
des.observations sur lesagrégats qu’on
se fait une idée ducomportement
de
l’individu,
c’est-à-dire de relationsqui pourraient
exister entre x; y; z; ,...Quelles hypothèses
raisonnablespeut-on
faire ?II. 2 - Ou bien le statisticien
possède
une(ou plusieurs)
coupes à un ins- tant t(ce qu’on appelle
cross-section enAmérique) c’est-à-dire,
sinon un"re- censement"
de tous les(x; t
y; ~~t)
pour t fixé etinvariant,
mais du moins un"sondage"
c’ est- à- dire un échantillon des(i)
enprincipe
nombreux.Et alors on veut se faire une idée de l’évolution future de
Y, Z,
... moyen-nant une hypothèse
sur l’évolution de X et à supposer que lescomportements
in-dividuels soient assez stables.
II. 3 - Ou bien le statisticien
dispose
à la fois des sériesstatistiques
pas- sées sur lesagrégats
et decross-section
les séries étantlongues
et les cou-pes bien
représentatives ; auquel
cas il n’est pasimpossible
de concevoirqu’on parvienne
à une bonnecompréhension
des mécanismes et desprévisions
vala-bles.
Cependant
onrisque
encore d’avoir des donnéesincomplètes, douteuses,
incohérentes.Le Statisticien aura une tâche ardue
d’ajustements
des données et d’esti- mation desparamètres,
mais on ne s’enpréoccupe
pas ici. Cequ’on
lui demanded’abord,
c’estd’adopter
un ensemble cohérent de micro et demacro-relations,
de relations
temporelles
et hors dutemps,
de liaisonsstochastiques
et fonc-tionnelles. Pour commencer, tenons-nous en aux liaisons
fonctionnelles.
III - UN RESULTAT SIMPLE -
Supposons
l’existence d’une micro-relation y ; -f(x;).
Il est banalqu’on
fasse l’erreur de croire lesagrégats
X = ZXi ~
Y = Zy;
liés par la macrorelation Y =f(X) ; (L.
Klein l’asignalé
à propos des lois à élasticitéconstante),
et c’estinexact,
à moins que f nedésigne
une fonctionlinéaire.
Mais en outre :Enoncé : La relation entre X et Y est une fonction si et seulement si la relation entre x et y est
linéaire ;
dans le casgénéral,
Y est une fonctionnelle de la dis- tribution des x et nedépend
pas exclusivement de Exi (ce qui empêche
de fairecomme
prévu
en II. 1 et II. 2 si la distribution sedéforme).
Ce résultat
important
s’établit enappliquant
la théoriestatistique
desmoyennes.
Les
points
de coordonnées[Xi’
y;= f(x; )]
sontrépartis
sur la courbe y =f(x)
dont on va admettre
qu’elle
est sansinflexion.
Le centre degravité
de cespoints
de coordonnées :
se trouve forcément situé dans la concavité de la
courbe,
cequi
entraîne :Admettons que Y soit fonction de X ; Y devrait être invariable
quand
on modifie la distribution des x; à l’intérieur de X = Z x;(en supposant
l’effectif N donné etfixe), en particulier
Y ne devrait paschanger
si l’onremplaçait
tous lesx ; i par leur moyenne
X,
cequi impliquerait :
Y =
Nf(X)
On
peut compléter
la démonstration ensupposant [y
=f(x) ]
munie depoints d’inflexion,
mais en modifiant la distribution des x; une secondefois,
defaçon
àrassembler les
points
sur un arc de courbe démunid’inflexions ;
ceci supposepourtant f"(X) ~ 0,
restriction sansgrande portée.
Que signifie
exactement le théorème ? Il invite àpréférer
leshypothèses
de structure linéaires. Toutefois : La fonction
f(x.)
ne doit pasdépendre
dutemps
t ;
celui-ci modifie seulement x ;. Si par hasard letemps
ne modifiaitpas ¿
x ;tout
en
changeant
individuellement certainsxi (ou
tous lesXi) l’agrégat
Y ne seraitpas modifié non
plus (les changements
survenus aux y; secompensant)
àplus
de2 dimensions :
Enoncé :
Si l’on suppose y ; =f(x; ),
z ; =g(x; ),
etc. lesagrégats Y,Z,...
sont fonctions del’agrégat
X = E x; sansdépendre
autrement de la distribution des x ;, si et seulement si les fonctionsf,
g, etc. sontlinéaires ;
il estsupposé
quef ,
g, etc. nedépendent
pas directement de t.Extension à des microrelations individualisées :
Supposons
àprésent
que les mi- crorelations s’écriventy~ - fi (xi),
avecpossibilité
d’avoir moins def
i que d’uni- tés desondage
N(cas
des groupes sociauxhomogènes).
Lescomportements
sont
supposés stables,
l’unité(i)
nechangera
pas de courbe au cours dutemps .
Nous disons encore que :
Enoncé : Les
agrégats Y, Z,...
sont fonctions del’agrégat
X = E x ,(sans dépen-
dre autrement de la distribution des
x)
si et seulement si les fonctionsf
g ¡ ....sont linéaires et de la forme :
En effet : Y ne doit pas
changer
sije
bouleverse les xi enconservant Zx; ;
doncje
vaisremplacer x,
parx 1
+ h etx2
parX 2 -h,
cequi donne, quel
que soit h :Supposons fl f 2 dérivables,
il en résulte que :quelles
que soient les variables entreparenthèses ;
c’est donc une constante a.Le reste en résulte.
IV - CAS DE L’ECONOMETRIE -
Dans un espace cartésien de coordonnées
(y~, z ; ... )
les microrelationsavec x; comme
paramètre
sontfigurées
par une droite(ou plutôt
une demi-droite,
x; y; z ; ... , étantpositifs).
Lorsqu’on change
lesmicrorelations,
cette demi-droitechange.
Ceci est très exactement le résultat de Gorman et
Nataf,
dont les courbesd ’Engel-sont rectilignes,
mais se modifientquand
le vecteurprix
estmodifié.
De même :
Les droites
d’Engel
des divers consommateurs ont une direction commune(ap ...)
La différence essentielle
serait,
endéfinitive,
que les achats d’un consom-mateur ne sont pas strictement
indépendants ;
celui-ci"boucle
sonbudget",
parune relation
(où figurent
lesprix
p.q)
py + qz + .... =
xalors que nous supposons y, z, ... fonctions de x seulement.
V - CAS DE LIAISONS
STOCHASTIQUES -
Si l’on
imagine
des microrelations de la forme y;=fi(xi)+ ’~ ; ,
z; =g; (x; )
+~;
où le
point
aléatoire(T)C ... )
suit une loi deprobabilité possédant
des moments d’ordre 1 nuls et desmoments
d’ordre 2finis,
lesagrégats ( 1:T), rç )
serontplus
ou moins
négligeables
à côtéde Zf,
E g ; et le cas def
= a ; + ccx~ etc. continue àprésenter
un certain intérêt. On n’abordera d’ailleurs pas ici l’étude de l’ar- ticle de Theil(Econometrica 1958).
VI - AGREGATS ET COURBE DE CONCENTRATION DE GINI. DIVERS -
Simple
remarquefinale,
les"tranches"
des distributionsstatistiques
sontlarges,
et lespraticiens
aiment avoir non seulement la ventilation par tranche des effectifs mais aussi desagrégats (nombre d’exploitations
deplus
de 100 haet
superficie correspondante).
Lareprésentation
d’une distribution par une courbe de Gini(effectifs
cumulés enabscisses, agrégats
cumulés enordonnées)
informealors bien mieux
qu’un histogramme,
et est donc à inclure dans lastatistique
desagrégats.
On notera que cette même courbe de concentration est commode pour étu- dier certains
problèmes théoriques,
comme cetteagrégation
oumélange
des popu- lationsstatistiques
de manière à obtenir unepopulation
de la même famille étu- diée par nous même en 19 5 5- 5 6(Publ.
de l’Institut deStatistique
de l’Université de ParisVI, 1957).
Disons un mot de
l’agrégation
de microrelations y =f(x)
pour unepopulation
stratifiée suivant des tranches de valeurs de x.
Du § III
ci- dessus découlequ’on
doit
postuler qu’à
l’intérieur dechaque
tranchedy/dx (et dY/dX)
a la valeur cons-tante a,
qui peut changer
d’une tranche àl’autre, -
si bien entendu onn’apas
d’information sur la distribution des x à l’intérieur dechaque
tranche. R,emar-quons que les frontières de strate se modifient en même
temps,
les unités sta-tistiques
étant censées ne pasquitter
leur strate.Pseudo-
agrégation -
Lapseudo-agrégation
est uneexception apparente
auxrègles précédentes.
Elle consiste à formuler sur la distribution des x; unehypothèse
destructure telle
qu’une "certaine" agrégation
deviennepossible. Supposer Y = F(X) ,
c’est
imposer
à la distribution des x ; la conditionl:f¡{x¡) -:
N F(Ex;/N) = 0 ;
uncas
particulier
intéressant est celui où f et F ont la même formeanalytique (et géométrique),
et diffèrent parquelque paramètre.
Exemple :
y;X2 /a,
Y =X2/b
si le coefficient de variation y des xi reste constant._1
On a en effet : b = a
N( 1
+y2)
Variation des microrelations f avec le
temps
t : Tout cequi précède
suppose t ab- sent def.
Admettons au contraire y;=y?f(t~x;).
Aquelle
condition a-t-onY=Y°f(t~Z)
avec Z =
Z(xl... x,).
Une telleagrégation implique f(t, xi )
=g(t)
+h(t) K(x 1)
du moment
qu’on
admet f dérivable.On voit en même
temps
queK(Z) = Iy~K(x,)/YB
En
particulier
on aura Z = X si yi =y~ g(t)
+xi h(t).
A ce propos on commet souvent l’erreur d’attribuer aux yi des taux de croissance