R EVUE DE STATISTIQUE APPLIQUÉE
T HIERRY F OUCART
Tableaux symétriques et tableaux d’échanges
Revue de statistique appliquée, tome 33, n
o2 (1985), p. 37-54
<http://www.numdam.org/item?id=RSA_1985__33_2_37_0>
© Société française de statistique, 1985, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
37
TABLEAUX SYMETRIQUES ET TABLEAUX D’ECHANGES
Thierry
FOUCART Département de mathématiques Université d’Orléans 45100 Orléans-La-SourceRESUME
L’analyse factorielle des correspondances d’un tableau
symétrique possède
despropriétés particulières
bien connues. Nous en déduisons une méthode élémentaire pour modifier les termes diagonaux du tableau de façon que leur moyenne soit égale à celle des autres termes et que les facteurs restent invariants.La description d’un tableau
d’échanges
consiste alors à effectuer l’analyse factorielle des correspondances du tableau symétrisé et à projeter sur les axes obtenus les lignes et les colonnes du tableau initialaprès
en avoir modifié la diagonale : chaque zone est représentéepar trois points dont l’un est le centre de gravité des deux autres
pondérés
par les exportationset les importations de la zône. La
procédure
peut s’étendre au cas de plusieurs tableauxd’échanges
et simplifie les techniques deprévision
basées sur la projection des facteurs. Nous donnons un exemple dans lequel nous montrons que ces méthodes sont moins efficaces qu’un simple ajustement du dernier tableau connu aux marges fixées.ABSTRACT
Correspondance factor analysis of a symmetrical board possesses its own specific and well known properties. We thence infer an elementary method to change the board diagonal
terms so that their average should be equal to the others’ and leaving the factors invariable.
The description of an exchange board therefore consists in carrying out a correspon- dance factor analysis of the symmetrised board and projecting the lines and columns of the initial board on the then obtained axes after modifying the diagonal: each area is represented by three points, one of which is the center of gravity of the two others pondered by the exports and imports of the area. The procedure can be extended to the case of several input-output
tables and simplifies the forecasting methods based on the factors’ projection. An example is given, in which we show that these methods are less efficient than a simple adjustment of the last known board to the fixed margins.
1. ANALYSE DES CORRESPONDANCE D’UN TABLEAU
SYMETRIQUE
Soit
NI J
un tableausymétrique :
I est l’ensemble deslignes
et J l’ensemble des colonnes. Bien que ces deux ensembles soientégaux,
nousgarderons
les notationsI et J. On note N la somme du
tableau, PI J
le tableau deprobabilité associé,
et n lenombre de
lignes (et
decolonnes)
du tableau. On pose :Revue de Statistique Appliquée, 1985, vol. XXXIII, n 2
Mots-clés :
Analyse factorielle, Correspondance symétrique, Ajustement
auxmarges, Tableaux
d’échanges.
38
La
symétrie
des données a uneconséquence
immédiate : les facteurs ~~définis sur I sont
également
les facteurs1/1 Q
définis surJ, au signe près :
Définition
On
appelle
facteur direct(resp. inverse)
un facteur ’PQ sur Iégal
au facteurde
même rang sur J(resp. opposé).
La nature des facteurs
dépend
essentiellement des termesdiagonaux :
suivant que ces derniers sont nuls ouélevés,
les facteurs auront tendance a être inversesou directs. Le lien entre la nature des facteurs et la
diagonale
du tableau a été étudiécomplétement
par J.P. BENZECRI(1973).
Soient u , v , w trois réels de somme 1. On pose :
où
P J
etPpIJ
sont les tableaux ci-dessous :avec :
Le tableau
P J
caractérise la liaison fonctionnelle entre leslignes
et lescolonnes,
le tableauPfJ l’indépendance
sous contrainte de marges. Les marges du tableauPu,’
sont évidemmentégales
àPI
etPJ.
Théorème
Si tous les termes du tableau
PijV
sontpositifs
ounuls,
les facteurs~u,v~
devariance 1 du tableau
PijV
sontégaux
aux facteurs dePIJ
et les valeurs propres03BBu,v~
se déduisent des valeurspropres B
par la formule suivante :E
(~~) (resp. Euy (~~))
étantégaux
à 1lorsque ~~
est direct pourPIJ (resp.
pourPu,vIJ),
et à - 1lorsque
~~ est inverse.Revue de Statistique Appliquée, 1985, vol. XXXIII, n* 2
39
Conséquence :
les facteurs d’un tableau restent invariantslorsqu’on ajoute
à sestermes
diagonaux
des nombresproportionnels
aux termesmarginaux
corres-pondants.
Il suffit de choisir en effet : u + v = 1.
On notera toutefois que l’ordre et la nature des facteurs
peuvent changer :
un facteur inverse de
rang Q
dePI J peut
devenir un facteur direct de rang m dePu,v
IJ .2. ETUDE DES TERMES DIAGONAUX
2.1. Maximisation de l’inertie
expliquée
par les kpremiers
axes(KAZMIERCZAK, 1978)
En utilisant les
propriétés précédentes,
onpeut
déterminer lesparamétres
uet v de
façon
que l’inertieexpliquée
par les kpremiers
axes(k fixé)
soit maximale.Plus
précisément,
ensupposant
u et vpositifs strictement,
on a :D’où la formule de reconstitution des données :
avec
Cette formule ne
dépend
que du facteur p =v/u.
En notant A l’ensemble des facteurs nonpris
encompte
etPi J
le tableaureconstruit,
on pose :L’erreur de reconstruction mesurée par
Ep (A*)
est minimale pour :La
procédure
consiste à minimiser parrapport
à A* l’erreurE03C1min (A*)
età
appliquer
unalgorithme
de donnéesmanquantes.
Les résultats
numériques
obtenus par KAZMIERCZAK sur un tableau demigrations
montrent l’intérêt de cette méthodequi permet
de diminuer nota- blement l’erreur de reconstruction pour un nombre de facteurs fixés. Onpeut regretter
toutefois lacomplexité
de sa mise en oeuvre : il faut calculer tous les facteurs et toutes les valeurs propres pour en déduire le meilleursystème.
Revue de Statistique Appliquée, 1985, vol. XXXIII, n° 2
40
2.2. Pondération de la
diagonale
Pour diminuer l’influence des termes
diagonaux
dans la taille des valeurs propreslorsqu’ils
sont nuls ou trèsélevés,
onpeut
penser à lespondérer (STEMMELEN, 1977).
Tenantcompte
de cetteidée,
nous allonsprocéder
de deuxfaçons
suivant que ladiagonale
du tableau est nulle ou non.- dans le cas où la
diagonale
estnulle,
on pose :Cette transformation laisse les facteurs invariants et la moyenne des termes
diagonaux
ainsi définis estégale
à la moyenne des termesextra-diagonaux puisque :
Elle
s’interprête
facilement : le termediagonal
défini estégal
à la moyenne des termes de la mêmeligne.
- dans le cas où la
diagonale
estchargée,
on pose :Il suffit de déterminer le coefficient a de
façon
que :On obtient facilement :
Notons que la formule revient à la
précédente
dans le cas d’unediagonale
nulle. Par
ailleurs,
ilpeut apparaître
des termesnégatifs ;
on pourra alors choisir pour a laplus grande
valeur telle que :mais
l’égalité
des moyennes tellequ’elle
est cherchée par STEMMELEN nepeut plus
être obtenue par cette méthode.L’avantage
de ces deuxprocédés
est surtout d’êtresimples d’emploi;
ilsne nécessitent pas le calcul
préalable
desfacteurs, et,
dansl’optique
de ladescrip-
tion d’une suite de tableaux
d’échanges,
ils écartent les valeurs propres les unes des autres ; l’invariance des facteurs dans la transformation de ladiagonale permet
de déterminer les facteurs de mêmeinterprétation
danschaque
tableauindépendam-
ment du rang des valeurs propres
associées ;
cettepropriété résoud,
au moins enpartie,
une difficulté rencontrée par STEMMELEN et MADRE(MADRE, 1980).
Revue de Statistique Appliquée, 1985, vol. XXXII I, n° 2
41 3. ANALYSE FACTORIELLE D’UN TABLEAU D’ECHANGES
Un tableau
d’échanges NI J
est constitué par définition par leséchanges
d’unezone, d’un pays ou d’une
région
parexemple,
que nousappelerons i,
et d’unezone j .
Enrègle générale,
les zonesexportatrices
sont enlignes
et les zonesimporta-
trices en colonnes. On a I =
J,
mais le tableau n’est passymétrique.
3.1. Procédures
classiques
On
peut
effectuerl’analyse
factorielle descorrespondances
deplusieurs façons :
(i)
le tableautransposé
étant notéN’IJ,
il estclassique
d’en déduire les tableauxsymétrique
etantisymétriques
enposant :
En effectuant
l’analyse
descorrespondances
du tableausymétrisé NÎJ,
onretrouve évidemment les
propriétés exposées
dans leparagraphe
1.(ii)
une autreprocédure
consiste àjuxtaposer
le tableaud’échanges
et sontransposé :
La
symétrie
de I et J estrespectée. chaque
zone estreprésentée
par troispoints:
laligne
icorrespond
à la suite desexportations
etimportations,
lescolonnes i et i + n aux
importations
et auxexportations respectivement.
(iii)
d’autres méthodesd’analyse
factorielle existent ; citons les travaux de CONSTANTINE et GOWER(1978), qui portent
sur les matricessymétriques
etantisymétriques,
d’ESCOUFIER et GRORUD(1979), qui
fontappel
àl’analyse
des données
complexes,
etc.3.2.
Analyse
factorielle ducouple (NIJ, Nj)
La
procédure développée
dans ceparagraphe
s’inscrit dans le cadregénéral
de la
description
d’une suite de tableaux deprobabilité (E. YAGOLNITZER, 1977 ;
T.FOUCART, 1978 ;
B.ESCOFIER, 1981).
La démarche est la suivante :Revue de Statistique Appliquée, 1985, vol. XXX III, n° 2
42
(i)
on effectue tout d’abordl’analyse
descorrespondances
du tableausymétrisé NsIJ,
obtenant ainsi un référentielpossédant
toutes lespropriétés
énoncées dans le
paragraphe
1 : facteursdirects, inverses,
etc.(ü)
ce référentiel est utilisé pourreprésenter
les lois conditionnelles enligne
du tableau initial
NI J
et de sontransposé.
Laprojection
des lois conditionnellesen colonnes
présente
ici un intérêt limité car elle est redondante avec laprécédente.
En
effet,
siFa correspond
aux facteurslignes
etGO(
aux facteurscolonnes,
on a,comme on le vérifie facilement avec les formules de transition :
Fa (i exp)
= faGO( (i imp) F 0( (i imp)
= EaG,,,, (i exp)
où
e. désigne
laparité
du facteur de rang a, i exp et iimp
la zone i définie par sesexportations
et sesimportations.
(iii)
onpeut également projeter
en élémentssupplémentaires
les marges des tableaux et les axesprincipaux
obtenus parl’analyse
descorrespondances
dechacun d’entre eux.
Cette
procédure
se résume par le schéma ci-dessous :éléments
supplémentaire*
Chaque
zone estreprésentée
par troispoints ;
lepremier
la caractérise parses
échanges
totaux(importations plus exportations),
le second par sesexportations
et le troisième par ses
importations.
Le tableau
NiJ
n’est autre que le tableau moyen des tableauxNI J
etN’IJ.
On retrouve donc les
principes d’interprétation déjà explicités
dans l’étude d’une suite de tableaux decontingence ;
onpeut
démontrer unepropriété barycentrique qui prend,
dans le cas d’un tableaud’échanges,
un intérêtparticulier.
Théorème
La loi conditionnelle sachant i du tableau
symétrisé NsIJ
est le centre degravité
des lois conditionnelles sachant i deNI J
etN’IJ pondérées
par lescoefficients ni,
etn.i
=ni.
On a en effet :
Revue de Statistique Appliquée, 1985, vol. XXXII I, n* 2
43 Les
points in,
i eti’ représentant
les lois conditionnellesPT, PIJ, P’iJ
seplacent
suivant le cas de l’une des
façons
ci-dessous :Cette
propriété barycentrique
n’est pas vérifiée si l’on modifie ladiagonale
du tableau
NsIJ
sans modifier aussi celles des tableauxNI J
etN;J.
Pourqu’elle
lesoit,
on modifiera lesdiagonales
de ces tableaux de lafaçon
suivante :(i)
dans le cas de termesdiagonaux nuls,
on pose :Cela revient
simplement
à définir comme termediagonal
deNIJ (resp N’IJ)
la moyenne des
exportations
dechaque
zone(resp.
desimportations).
On noteraque les deux tableaux
NIJ
etNjj,
une foistransformés,
n’ont pas la mêmediagonale
et ne sont
plus transposés
l’un de l’autre.(ii)
dans le cas de termesdiagonaux
nonnuls,
on pose :Le coefficient a est défini comme cela est
indiqué
dans leparagraphe 2.2 ;
comme dans le cas
précédent,
les deux tableaux ne sontplus transposés
l’un del’autre
après
transformation.Il existe évidemment d’autres méthodes de
pondération
de ladiagonale
d’untableau
d’échanges.
Onpeut
parexemple
modifier le tableau defaçon
que les termesdiagonaux
soientégaux
auproduit
des termesmarginaux correspondants (Le FOLL, BURTSCHY, 1981).
Cela revient à reconstituer ladiagonale
considéréecomme
manquante
au1 er ordre,
et la contribution des termesdiagonaux
à l’inertietotale du tableau devient nulle. Nous voyons deux inconvénients à cette méthode :
- tout
d’abord,
les marges sont modifiées :chaque
zone est affectée d’unpoids
difficile à
interpréter
et les facteurs ne sontplus
les mêmes.Revue de Statistique Appliquée, 1985, vol. XXXII I, n° 2
44
-
ensuite,
onignore
si la reconstruction des termesextra-diagonaux
est amélioréepuisque
l’inertie totale n’est pas invariante dans la transformation.3.3.
Analyse
d’une suite de tableauxd’échanges
On
peut
sans difficultégénéraliser
la méthodeproposée
pour étudier une suite de T tableauxd’échanges,
indexés par letemps
parexemple.
La démarche est alorsla suivante :
(i)
on transforme lesdiagonales
dechaque
tableau de la suite suivant la méthodeexpliquée précédemment. Chaque
tableau est ainsi dédoublé enNtIJ
etN’tIJ qui
sedistingue
dutransposé
par les termesdiagonaux.
(ii)
on calcule le tableau moyen de la suite des 2T tableaux obtenus: il n’est pas nécessaire depondérer
sadiagonale qui
vérifiedéjà
les critéres duparagraphe
2.2.(iii)
onprojette
ensuite les lois conditionnelles enlignes
des tableauxNtIJ
et
N’tIJ sur
les axes obtenus parl’analyse
descorrespondances
du tableau moyen.(iv)
onpeut
aussiprojeter
la suite des marges.Chaque
zone étantreprésentée
pourchaque
tableau par troispoints,
lareprésentation risque
d’être difficile àinterpréter,
mais ilpeut apparaître
desévolutions
régulières qui
incitent à effectuer uneprojection
dans letemps
si les données sontchronologiques.
Une méthode de
projection
trèssimple peut
êtreenvisagée (STEMMELEN, 1977) :
elle consiste à calculer les droites des moindres carrés parrapport
autemps
sur les coordonnées des facteurs obtenus par
l’analyse
descorrespondances
dechaque
tableau. En negardant
que les axessignificatifs,
on diminue le nombre derégressions
à effectuer en conservant le maximum d’information et en éliminantplus
ou moins lesperturbations
aléatoirescorrespondants
éventuellement auxderniers axes.
facteurs retenus
Une fois les facteurs
projetés,
onapplique
la formule de reconstitution des données pour reconstruire un tableauqui
est ensuite utilisé comme tableau initial pourajuster
les marges(que
l’on suppose engénéral connues)
à l’aide del’algo-
rithme R.A.S. par
exemple.
Onpeut
aussi déduire desprojections
des facteurs unebase
(orthonormée
pour lamétrique du x2
définie par les margesfixées)
à l’aidede la méthode d’orthonormalisation de SCHMIDT
(MADRE, 1980).
Cetteprocé-
dure
possède l’avantage
de conserver, pourchaque
valeur de l’entierk,
les sous-espaces
engendrés
par les kpremiers
vecteurs.Cette méthode de
projection
n’estapplicable
que sous certaineshypothèses.
Sans
parler
de cellesqui
concernent la naturetemporelle
des données(elles
n’ontRevue de Statistique Appliquée, 1985, vol. XXXt)), n* 2
45 pas été abordées par les auteurs
cités),
on voit immédiatement que l’ordre des facteurs de mêmeinterprétation
n’est pastoujours
le même dans tous les tableaux.Il est donc
indispensable
depouvoir procéder
à desregroupements indépendam-
ment de la taille des valeurs propres.
Dans cette
optique,
lespropriétés développées précédemment
sont intéres-santes : la
pondération de
ladiagonale
d’un tableausymétrique
a pour effet d’écarter les valeurs propres les unes des autres sans modifier les facteurs. Onpeut
doncenvisager
laprocédure
suivante :(i)
considérer la suite des tableauxsymétrisés
(ii)
transformer lesdiagonales
suivant l’une des deux méthodesproposées (iii)
retenir les facteurssignificatifs
obtenus parl’analyse
descorrespondances
de
chaque
tableau.(iv) régresser
cesfacteurs,
reconstruire le tableausymétrique
etl’ajuster
auxmarges fixées pour obtenir une
prévision
du tableaud’échanges.
Notons en outre que, les tableaux étant
symétriques,
les facteurs’fJ2
et"’2
sont
égaux
ausigne prés ;
cettepropriété
divise par deux le nombre derégressions
à effectuer.
4. APPLICATIONS
4.1.
Description
deséchanges
commerciaux intra-CEE de 1981Nous avons étudié par la méthode décrite dans le
paragraphe
3.2. le tableaud’échanges
intra-CEE de 1981(tableau 1);
sadiagonale
éant initialementnulle,
nous avons
procédé
au calculpréalable
des termesdiagonaux
suivantl’approche expliquée
dans leparagraphe
2.2.Après
avoir examiné lesconséquences
de cette transformation sur laqualité
de lareprésentation,
nousprésentons
les résultats del’analyse
factorielle descorrespondances
ducouple (NIJ, N’IJ).
TABLEAU 1
Echanges
intra CEE de 1981RFA:
République
Fédéraled’Allemagne,
FRA:France,
ITA:Italie,
P.B. :Pays- Bas,
BLX :Bénélux,
R.U. :Royaume-Uni,
IRL : Irlande. Dan : Danemark.Revue de Statistique Appliquée, 1985, vol. XXXII I, n° 2
46
Choix des axes
principaux
En nous limitant tout d’abord à l’étude du tableau
symétrisé,
nous nousproposons d’étudier ici les
conséquences
de lapondération
de ladiagonale
sur laqualité
de la reconstruction deséchanges
suivant différentscritères.
On
dispose
évidemment de la mesureclassique
donnée par la somme des valeurs propres nonprises
encomptes
dans la formule dereconstitution ;
on sait que cette somme estégale
au carré de la distancedu X2 entre
le tableau de données et le tableau reconstruit. Dans le cas d’un tableausymétrique
dont les termesdiagonaux
n’ontqu’une importance relative,
cet indice n’est pas trèsadapté puisqu’il
tientcompte
de la reconstruction de ladiagonale.
Nous proposonsdonc,
en
complément,
le même indice limité aux termesextra-diagonaux,
endécomposant
la formule de reconstitution des données de la
façon
suivante(NIJKAMP, PAELINCK, 1976) :
où
p*i,j
estl’échange (i,j)
du tableau reconstruit par les kpremiers
axes.Rappelons
que lapondération
de ladiagonale respecte
les loismarginales
et ne modifie que les valeurs propres ainsi que l’ordre et la
parité
des facteurs. Ona les résultats suivants :
Dans un
premier temps,
nous avons reconstitué les données à l’aide de deux premiers axes ; laqualité
de la reconstruction est bien meilleureaprès
modification de ladiagonale :
les distances duX 2
entre tableau initial et tableau reconstruitpassent
de 0.154 a 0.081. Lesécond
critère est aussilargement
amélioré : la contribution absolue des termesextra-diagonaux
à ces distancespassent
de 0.109 à 0.060.On aboutit aux mêmes conclusions en considérant les trois
premiers
axes.Description
deséchanges
intra-CEE en 1981Compte-tenu
des résultats duparagraphe précédent,
nous nous limitons àl’étude du tableau à
diagonale
transformée. Lequatrième
axe du tableau initial est ainsiplacé
aupremier
rang.Les deux
premiers
facteursexpliquent
61 % del’inertie,
et la liaison entre lesexportations
et lesimportations
esmble caractérisée surtout par deux pro-priétés
mises en évidence dans lareprésentation graphique
duplan
1 x 2(Fig. 1).
Le
premier
facteur est direct : il oppose leRoyaume-Uni
et le Danemark aureste de la CEE. Le deuxième facteur est inverse : il est déterminé par les
profils
du commerce de
l’Allemagne
et desPays-Bas.
On retrouve l’Irlande et leRoyaume-
Uni sur le troisième axe
qui
est inverse.L’interprétation
de cettereprésentation graphique
étantclassique,
nous n’insisterons pasplus
sur cepoint.
Revue de Statistique Appliquée, 1985, vol. XXXIII, n° 2
47 Figure 1. - Echanges moyens intra-CEE (1981)
Majuscules : exportations. Minuscules : importations
(le,
facteur direct, 2e facteur inverse).Figure 2. - Echanges INTRACEE (1981) Exportations (codées 1 )
Importations (codées 2)
La
figure
2 est obtenue enreprésentant
en élémentssupplémentaires
leslignes
des tableauxNI J
etN;J.
Nous avonsreprésenté
le tableau moyen par despoints
situés donc aux centres degravité
des identificateurscorrespondants.
Ilapparait
clairement sur ce schéma que lesexportations (codées 1)
et lesimpor-
tations
(codées 2)
d’un même pays ont desprofils
voisins: les clients sontégalement
les fournisseurs. Laplus grande
différence concerne l’Irlande(non
Revue de Statistique Appliquée, 1985, vol. XXXIII, n° 2
48 Revue de Statistique Appliquée, 1985, vol. XXXII I, n° 2
49
représentée),
leRoyaume-Uni (R-U1
etR-U2)
et le Danemark(DAN1
etDAN2).
On remarque la
particularité
du commerce de l’Irlande et del’Angleterre
au béné-fice de cette dernière.
4.2. Etude des
migrations
dans la banlieueparisienne
Nous avons
repris
les données de KAZMIERCZAK(1978)
pour étudier les effets de la modification des termesdiagonaux
dans le cas d’unediagonale chargée.
Il
s’agit
desmigrations
entre 15 zones de larégion parisienne ;
le termenij
dutableau donne le nombre de
départs
de lazone j
vers la zone i(le
nom des zonesest donné sur le tableau
2).
Il s’est révélé
impossible
d’obtenir des termesdiagonaux
de moyenneégale
àcelle des termes
extra-diagonaux
enrespectant
les marges. Nous avons donc déter- miné le coefficient a tel que tous les termes de ladiagonale
sontpositifs
ou nuls.Nous
donnons ci-dessous les valeurs propres obtenues sur le tableausymétrisé
initial
(1 ere ligne)
etaprès
transformation de ladiagonale (2e ligne).
Lescinq
pre- miers facteurs sont invariants dans la transformation.La modification de la
diagonale
a donc pour effet une diminution de l’inertie totale et de chacune descinq premières
valeurs propres ; lespourcentages
d’inertieexpliquée
parchaque
axeaugmentent
et les valeurs propres s’écartent les unes des autres.Le critère étant celui de la somme des valeurs propres non
prises
encompte
dans lareconstruction,
ilapparait
defaçon
évidente que la reconstruction est bien meilleureaprès
lapondération
des termesdiagonaux (1,445
au lieu de4,41
pour les deuxpremiers
axesetc.).
L’autre critère défini par la contribution absolue des termesextra-diagonaux
conduit a la même conclusion : sa valeur passe de0,855
à0,429.
Ce critère n’est pasoptimisé
parl’analyse puisque
leplan
1x3 donne unemoins bonne
représentation
des termesextra-diagonaux
que leplan
1 x4(0,547
et
0,532).
La reconstruction obtenue par Kazmierczak est nettement meilleure
(cf.
paragraphe 2.1).
L’analyse
factorielle du tableau desmigrations
donne en fait des résultatscomparables
que l’on transforme ou non ladiagonale.
Les facteurs restant invariants et ordonnés de la mêmefaçon,
les coordonnées varient dans unrapport égal
à laracine carrée du
rapport
des valeurs propres. Les caractères ‘‘ · "représentent
leszones
géographiques
du tableausymétrisé
et sont les centres degravité
des identifi-cateurs de ces zones
pondérées
par les termesmarginaux.
Leplan
1 x 2(Fig. 3)
metbien en évidence certains
déséquilibres migratoires :
lesdéparts (codes 2)
sontplus
nombreux que les arrivées
(codées 1)
dans les zonesValenton, Fresnes, Rungis,
etmoins nombreux dans les zones
Charenton,
Thiais etIvry.
Revue de Statistique Appliquée, 1985, vol. XXXIII, n° 2
50
Figure 3. - Migrations interurbaines
1
arrivées2 : départs
. :
points moyens ORLY et VITRY sont confondus.4.3.
Analyse
de l’évolution du commerce extérieurNous avons effectué
l’analyse
de la suite des tableaux du commerce extérieur intra-CEE de 1973 à 1980 pour tenter de reconstituer leséchanges
de 1981 en pro-jetant
les facteurs.La
figure
4représente
leplan principal
1 x 2 calculé sur le tableau moyen(contribution
de 65%
a l’inertietotale).
Pour faciliter la lecture duschéma,
nousnous sommes limités à
projeter
lesprofils
définis par lesexportations
dechaque
tableau et numérotés de 1
(1973)
à 8(1980). Figurent
aussi sur ce schéma lesexportations
réelles de 1981(point 9),
reconstruites parl’algorithme
R.A.S. initia-lisé par le tableau de 1980
(point 10)
et obtenues enrégressant
les facteurs(point 11).
Lesdiagonales
ont été évidemment modifiées.Pour effectuer cette
régression,
nous avons conservé les troispremiers
facteursde
chaque
tableau et obtenons les vecteurs et valeurs propres suivantes :Revue de Statistique Appliquée, 1985, vol. XXXHt, n" 2
51 Figure 4. - Exportations INTRACEE de 1973 (1) à 1980 (8)
en 10 exportations en 1981 (RAS sur 1980) suppl 11 : exportations en 1981 (Projections des facteurs)
9 exportations réelles en 1981.
Effectuer une
simple régression
des moindres carrés pour obtenir uneprévi-
sion des facteurs est évidemment discutable : aucune
hypothèse
n’est faite sur lecaractère temporel
des données(stationnarité
parexemple). Compte
tenu descontraintes d’orthonormalité
qu’ils
doiventvérifier,
les facteurs nepeuvent
êtrestables. Il ne faut toutefois pas
perdre
de vue que le but de laprocédure
n’est quede construire un
"squelette"
àpartir duquel
on reconstruira un tableaud’échanges possédant
desmarges
fixées.Comme nous l’avons
déjà précisé,
la formule de reconstruction donne untableau dont les termes
diagonaux
ne sont pasnuls;
pour obtenir laprévision
défi-nitive,
nous les avons mis à zéro avantd’appliquer l’algorithme R.A.S.,
les margesRevue de Statistique Appliquée, 1985, vol. XXXIII, n* 2
52 Revue de Statistique Appliquée, 1985, vol. XXXII I, n° 2
53 fixées étant celles de 1981. Le tableau 3
permet
de comparer les estimations aux valeurs réelles donnéesprécédemment :
La
prévision
n’est pas très satisfaisante. Onpourrait regretter
de n’avoir consi- déré que les troispremiers
axes, mais l’examen desquatrième
etcinquième facteurs
laisse penser que nous aurions rencontré
quelques
difficultés dans leurprojection
à l’horizon fixé. Les valeurs propres associées ont en effet tendance a se
confondre,
ce
qui
a pourconséquence :
i)
unepermutation
éventuelle des facteurs de mêmeinterprétation
ü) une
instabiliténumérique
dans le calcul des vecteurs propres(valeurs
propres
doubles)
Pour mesurer la
précision
desestimations,
nous avonssimplement ajusté
letableau observé en 1980 aux marges du tableau 1981
(Tabl. 4).
Les marges des trois tableaux étant alors lesmêmes,
les distances duX 2
sontcomparables. L’ajustement
du dernier tableau observé
donne,
suivant cecritère,
un bien meilleur résultat(0,002
au lieu de0,06).
Cette conclusion est d’ailleurs visible sur lafigure 4,
surlaquelle
lespoints
codés 10(R.A.S.
sur le tableau de1980)
sontsystématiquement plus près
despoints
codés 9(tableau réel)
que lespoints
codés 11(R.A.S. après
pro-jection
desfacteurs).
CONCLUSIONS
Les méthodes de
description développées
dans cet article ont donné de bons résultats dans ladescription
des tableaux de données que nous avons étudiés. Elles sontsimples d’emploi,
faciles àinterpréter,
et le calcul des termesdiagonaux
neprésente
aucune difficulté. Unesimple manipulation
de fichiers suffit pourpouvoir
utiliser un
logiciel classique d’analyse
descorrespondances.
Si,
dans le cas de donnéeschronologiques,
une tendance est mise enévidence,
cela ne
signifie
pas que laprojection
des facteurs vapermettre
une bonneprévision
des
échanges
à un horizonchoisi,
même si les marges sont fixées. Dansl’exemple
que nous donnons comme dans les autres données que nous avons
traitées, l’ajuste-
ment du dernier tableau observé aux marges fixées donne de meilleurs résultats que
l’ajustement
du tableau obtenu enappliquant
la formule de reconstitution des données apartir
desprojections
des facteurs. A cetitre,
leproblème
reste ouvert :comment
intégrer
la naturetemporelle
desdonnées,
que l’on retrouve defaçon
évidente dans les
analyses,
à une méthode deprévision
d’une suite de tableaux decontingence ?
C’est l’une des
questions auxquelles
réfléchit un groupe de travail du GRECO 59Analyse
des Données etInformatique,
dont les discussions sont àl’origine
decertaines des idées
exposées
dans cet article.Revue de Statistique Appliquée, 1985, vol. XXXIII, n° 2
54
BIBLIOGRAPHIE
J.P. BENZECRI
(1973). 2014 L’analyse des
données tome 2l’analyse
des correspon-dances,
p.231,
243Dunod,
Paris.A.G.
CONSTANTINE,
J.C. GOWER(1978). - Graphical representation of asym-
metric matrices
Applied Statistic, 27,
3 p.297,
304.B. ESCOFIER
(1981). 2014 Quelques
indices decomparaison
de tableaux de contin- gence.Statistique
etanalyse
desdonnées,
Vol.6, n° 1,
p.39,
51.Y.
ESCOUFIER,
A. GRORUD( 1979). - Analyse
factorielle des matrices carréesnon
symétriques, 2e
Journées Internationales.Analyse
des données etinfor- matique.
Editeur North Holland.T. FOUCART
( 1978). -
Sur les suites de tableaux decontingence
indexés par letemps. Statistique
etanalyse
desdonnées, n° 2,
p.67,
85.J.B. KAZMIERCZAK
( 1978). - Migrations
interurbaines dans la banlieue sud de Paris. Cahiers del’analyse
desdonnées,
Vol. 3n° 2,
p. 203. 218.Y. Le
FOLL,
B. BURTSCHY(1983). - Représentation optimale
des matricesimports-exports.
Revue deStatistiques appliquées,
Vol.31, n° 3,
p.57,
72.J.L. MADRE
(1980). -
Méthodesd’ajustement
a des marges. Cahiers del’analyse
des
données,
Vol.5, n° 1,
p.87,
100.P.NIJKAMP,
H. PAELINCK(1976). -
Some methods forupdating input-output
tables. Revue
belge
destatistique, d’informatique
et de rechercheopéra- tionnelle, Vol. 16, n° 4, p. 17, 41.
E. STEMMELEN
(1977).
Tableauxd’échanges : description
etprévision.
Cahiersdu BURO série
Recherche, n°
28.E. YAGOLNITZER
(1977). - Comparaison
de deuxcorrespondances
entre lesmêmes ensembles. Cahiers de
l’analyse
desdonnées,
Vol.2, n° 3,
p.251, 264.
Revue de Statistique Appliquée, 1985, vol. XXXIII, n° 2