R EVUE DE STATISTIQUE APPLIQUÉE
T HIERRY F OUCART
Suites de tableaux et de sous-tableaux
Revue de statistique appliquée, tome 29, n
o2 (1981), p. 31-42
<http://www.numdam.org/item?id=RSA_1981__29_2_31_0>
© Société française de statistique, 1981, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
31
SUITES DE TABLEAUX ET DE SOUS-TABLEAUX
Thierry
FOUCARTI.U.T. Departement Statistiques Kercado B.P. 1104, 56008 Vannes
Nous utilisons dans cet article une méthode de
description
d’une suite detableaux de
probabilités
et une notion de structure d’une suitedéjà
connuespour déterminer une relation entre un tableau de
probabilités
et un sous-tableau.L’exemple numérique présenté
montrequel
genred’application
onpeut envisager : ayant
à notredisposition
leséchanges
de blé entre les seizerégions françaises
de 1967 à1973,
nous cherchons à les reconstruire pour1974,
en sup-posant
que le tableau de 1974possède
la structure de la suite et que leséchanges
entre
sept régions
sur seize sont connus.1. DESCRIPTION ET PREVISION D’UNE SUITE DE TABLEAUX DE PROBABILITES
Nous proposons dans ce
paragraphe
un aperçu de la méthode dedescription
et de
prévision
utilisée dans la suite. Cette méthode estinspirée
de la méthode STATIS[1] [2].
1.1. DESCRIPTION
[3]
On considère une suite de tableaux de
probabilités (P(t))
t ~ K définissur le
produit
cartésien I x J. Achaque
tableau deprobabilités P(t)
on associele tableau de Burt
B(t)
défini de lafaçon
suivante :Revue de Statistique Appliquée, 1981, vol. XXIX, n° 2
où :
-
P’(t)
est le tableautransposé
deP(t)
-
’PI (t)
etPJ (t)
sont les marges du tableau P(t)
sur 1 et Jrespectivement
-
DpI(t)
etDPJ(t)
sont les matricesdiagonales
définies par les marges :On
peut
alorsappliquer
la méthode STATIS. Eneffet,
le tableau de BurtB(t)
est, dans la basecanonique
deRn+m,
la matrice d’unopérateur analogue
à un
opérateur
de covariance.L’opérateur
de "Burt" ainsidéfini,
que l’on noteégalement B(t), appartient
àl’espace
euclidien desopérateurs symétriques
deRn+m ;
dans cet espace, leproduit
scalaire estégal
à la trace(tr)
duproduit
decomposition [4] : PS(B(t) , B(t’))
=tr(B(t). B(t’)).
Pour décrire des
angles
entre lesopérateurs B(t),
on effectuel’analyse
factorielle du tableau des
produits
scalairesPS,
cequi
revient à effectuer uneanalyse
encomposantes principales particulière
du tableau X constitué par lesopérateurs
écrits enlignes
et considérés comme s’ils étaient des caractères[5] :
Les vecteurs propres unitaires
a(·,~)
de la matrice PS desproduits
sca-laires entre les
opérateurs B(t),
associés aux valeurs propresÀQ rangées
dansl’ordre décroissant sont les facteurs
principaux.
En notant
C(~)
la Qecomposante principale
unitaire pour lamétrique
identité,
onpeut
écrire les relations ci-dessous :où :
- r est le nombre de
composantes principales (R
={1,2 ... , r})
-
a(t, Q)
est late composante
du facteura(., Q) : L a(t , 2)2
= 1 .t
Selon que les
opérateurs
sont normés ou non, lescomposantes princi- pales
maximisent un coefficientanalogue
à un cosinus(coefficient RV)
ouà un
produit
scalaire(coefficient COVV) [6].
1.2. STRUCTURE DE LA SUITE. PROCEDURE DE PREVISION
[7]
Définition. -
Onappelle
structure de la suite des tableaux deprobabilités (P (t))
t E K définis sur leproduit
cartésien I x J le sous-espace vectoriel de Rnmengendré
par cette suite.La notion de structure ainsi définie est
comparable
à celle depotentiel
de
prévision développée
par J.P. PAGES[5 ].
On établit facilement les résultats
suivants, qui permettent
de considérer indifféremment les tableaux de Burt ou les tableaux deprobabilités :
Propriété
1. - Lescomposantes principales
norméesC(Q) peuvent
s’écrire sous la forme du tableau ci-dessous :où :
-
Q(~) =
v ÀQ
t = 1a(t , ~) P(t)
-
Q’(2)
est le tableautransposé
deQ(Q)
-
QI(~)
etQJ(2)
sont les marges du tableauQ(2)
sur 1 et Jrespectivement
-
DQI(Q)
etDQJ(Q)
sont les matricesdiagonales
définies par les marges.Précisons que
C(~)
n’est pas nécessairement un tableau de Burt.Propriété
2. - Un tableau deprobabilité
P défini sur I x Jpossède
la structurede la suite
(P(t))
t E K si et seulement si l’une despropriétés
ci-dessous estvérifiée :
(i) l’opérateur
de Burt associé B est combinaison linéaire desopérateurs
k
de Burt
B(t) :
B= 03A3 u(t) B(t)
t=i
(ü) l’opérateur
de Burt associé B est combinaison linéaire des compo- santesprincipales
C(Q) :
où
(iü)
le tableau P est combinaison linéaire des tableauxQ(Q) :
Propriété
3. - Soit P un tableau sur 1 x J vérifiant la relation(5).
P est un tableaude
probabilités
si et seulement si les coordonnéesc(~)
vérifient les relations :Ces deux relations définissent le
simplexe
des lois deprobabilités.
La
procédure
deprévision
est alorssimple :
lescomposantes principales C(Q)
étantfixées,
onrégresse
parrapport
autemps
lescomposantes du Qe
facteur à l’horizon Hchoisi ;
si l’on notea(H , Q)
laprévision du Qe
fac-teur, la
prévision
del’opérateur
est donnée par :On en déduit facilement la
prévision
du tableau deprobabilités :
Les
régressions
des facteursa(t, Q)
doivent être effectuées enprincipe
sous les contraintes définies par les relations
(6)
et(7).
On ne conserve d’autrepart
que les facteursprincipaux jugés significatifs.
2. ETUDE CONJOINTE D’UNE SUITE DE TABLEAUX DE PROBABILITES ET D’UNE SUITE DE SOUS-TABLEAUX
A la suite de tableaux de
probabilités (P(t))
t E K définis sur I xJ,
nousassocions la suite des tableaux de
probabilités (Po(t))
t E K définis sur10
xJo
de la
façon
suivante :2.1. RELATION ENTRE UN TABLEAU ET UN SOUS-TABLEAU
- Restriction de P à
Po
Soit P un tableau de
probabilités
sur 1 x Jpossédant
la structure de lasuite,
etPo
le sous-tableau défini commeprécédemment
surI0 x J0.
r
Nous avons,
d’après l’équation (5) :
P= 03A3 a(Q) 03BB~ Q(Q) .
Q=i
D’où, d’après
la relation(9) :
où
Q1(~)
est la restriction deQ(Q)
àI0 x J0 :
D’autre
part,
lapropriété
1 et la relation(8)
ont pourconséquence :
Des
équations (10)
et(11),
nous déduisonsRemarque. -
Le sous-tableauPo possède
la structure de la suite(Po(t))
t E K .Réciproquement Po peut posséder
la structure de la suite(Po(t))
t E K sansque P
possède
celle de(P(t))
t ~ K.- Etude de la suite
(P0(t))
Considérons maintenant la base des ro
composantes principales Co(p)
obtenues par
l’analyse
desopérateurs
de BurtBo(t)
associés aux sous-tableauxPo(t).
Nous pouvons utiliser les résultats énoncés auparagraphe
1 :-
Rapprochement
des deux résultats.La relation
(12)
est vérifiée par lesopérateurs
de BurtBo
etBo(t) ;
endéveloppant chaque
membre sur la base descomposantes principales Co(p),
nous obtenons
l’égalité
des coordonnées surchaque composante principale :
où
c(~)=a(~) 03BB~.
Cette
égalité s’exprime
sous forme matricielle :Théorème. - Les coordonnées
c(Q)
du tableau P sur lescomposantes princi- pales C(Q)
et les coordonnéesb(p)
du tableauPo
sur lescomposantes prin- cipales Co (p)
vérifientl’égalité :
où :
-
BR
est le vecteur colonne défini par les coordonnées dePo
sur les compo-santes principales Co (p) (p
~Ro
={1 , 2 ,
... ,r0})
-
BKR0
est le tableau à rolignes
et kcolonnes,
late
colonne étant définie par les coordonnées del’opérateur B0(t)
sur lesro composantes principales C0(p)
-
Da
est la matricediagonale
définie par les coefficientsa (t) :
-
AKR
est le tableau des facteursunitaires,
écrits encolonnes,
obtenus parl’analyse
desopérateurs
de BurtB(t)
-
D1/03BB
est la matricediagonale
définie par les valeurs propresÀQ
-
CR
est le vecteur colonne défini par les coordonnées del’opérateur
B surles r
composantes principales C(~).
2.2. PROCEDURE DE PREVISION
La relation que nous venons d’établir
peut
être utilisée pour effectuerune
prévision
d’un tableau deprobabilités
àpartir
d’un sous-tableausupposé
connu
Po’
Etudions tout d’abord le cas où ce sous-tableau
possède
la structure dela suite des
sous-tableaux ;
nous faisonsl’hypothèse qu’il
existe un tableau deprobabilités
Ppossédant
la structure de la suite et dont la restriction sur10
xJo
est
égale
àPo ;
onprocède
alors de lafaçon
suivante :(i)
calcul de la matrice M : M =B K D03B1ARKD1/03BB (avec
les notationsprécédentes) 0
(ii)
calcul des coordonnéesBR
dePo
dans la base descomposantes principales
(üi)
calcul des coordonnéesCR
du tableau P par résolution dusystème
linéaire :M CR = a BR où
le coefficient a est fixé defaçon
que la somme du tableau Psoit égale
à 1(iv)
reconstruction du tableau P à l’aide de la formule de reconstitution des données.L’application pratique
que nous avons effectuée se révèleplus complexe.
En
effet,
le sous-tableauPo
nepossède
pas dans ce cas-là la structure de la suite des sous-tableaux(Po(t))
t ~ K et on nepeut
doncprocéder
de lamême
façon
queprécédemment.
Plusieurs démarches sont alorsenvisageables :
- on
peut
abandonner l’idée de reconstituer exactement le sous-tableauPo
et
projeter
ce dernier en élémentsupplémentaire ;
on obtient ainsi les coor-données d’un sous-tableau
P’ 0 qui
n’est pas nécessairement un tableau deprobabilités : l’hypothèse
que nous faisons est l’existence d’un tableauP’
combinaison linéaire des
composantes principales
et dont la restriction à1 0 x Jo
estégale
àP’0.
Ce tableau n’est pas un tableau deprobabilités puisque
le sous-tableauPo
n’en est pasun ;
- on
peut
aussiajouter
à la suite des sous-tableaux(Po(t))
t E K le sous-tableau
Po
et calculer lescomposantes principales
parl’analyse
de lasuite ainsi constituée. Les coordonnées de
Po
sur lescomposantes prin- cipales permettent
de le reconstituer exactement. Onpeut
alors chercherun tableau P dont la restriction à
Io
xJo
estégale
àPo ;
commeci-dessus,
ce tableau n’est pas un tableau de
probabilités.
Nous avons
appliqué
ces deux méthodes et il se trouve que les meilleurs résultats ont été obtenus à l’aide de lapremière.
Celas’explique peut-être
par le faitqu’ajouter
le sous-tableauPo
à la suite(Po(t))
t E Kaugmente
ladimension de la structure sans
qu’il
existe la dimensioncorrespondante
dansla structure de la suite
(P(t))
t E K .3. APPLICATION
PRATIQUE
Les données que nous avons utilisées pour
appliquer
la méthodeproposée
dans les pages
précédentes
sontdéjà
bien connues[3], [8] :
ils’agit
des tableauxd’échanges
de blé entre seizerégions françaises
échelonnés de 1967 à1974 ;
leséchanges
de 1968 sont inconnus. Nous nous sommesplacés
devant leproblème
suivant : les
échanges
de 1967 à 1973 étantdonnés,
est-ilpossible
de lesprévoir
à l’horizon 1974 en
supposant
certains d’entre eux connus ? Nous avons donc considérésept régions
surseize, représentant
environ la moitié deséchanges
et le sous-tableau
Po
constitué par leséchanges
entre cessept régions.
La définition des
régions
est donnée en annexe.3.1. DESCRIPTION DE LA SUITE DES SOUS-TABLEAUX
La
figure
1représente
leplan engendré
par les deuxpremières
compo- santesprincipales obtenues
parl’analyse
desopérateurs
de Burt associés auxsous-tableaux. Les
points correspondants
aux six tableaux de 1967 à 1973 sontplus
ou moinsalignés
et donnentl’image
dusimplexe
des lois deproba-
bilités dans le
plan
des deuxpremières composantes principales.
Le sous-tableau 1974 a été
projeté
en élémentsupplémentaire
et estreprésenté
par lepoint
74.Nous tenons les résultats
numériques
de cetteanalyse
à ladisposi-
tion des lecteurs. Précisons toutefois que la
première
valeur proprerepré-
sente
99,5
% de l’inertie totale et la seconde0,4 % ; l’importance
de cescontributions est une
caractéristique
de la méthode STATIS.3.2. PREVISION ET DESCRIPTION DE LA SUITE DES TABLEAUX Nous avons effectué la
prévision
à l’horizon 1974 comme il a étéindiqué précédemment :
nous construisons un tableaud’échanges
tel que sa restrictionaux
sept régions
choisies soit laplus proche possible
du sous-tableaudonné,
doncsoit
égale
à laprojection
de ce dernier. Les résultats ci-dessouspermettent
de comparer le sous-tableauPo
donné au sous-tableauprojeté P’0. (cf.
tableaux1 et
2)
et le tableau effectivement réalisé P au tableauprévu P’ (cf.
tableaux3 et
4).
Quelques
différencesapparaissent
entre le sous-tableauPo
et saprojec-
tion ;
certains termes deviennentnégatifs
mais restent si faibles en valeur absolue que nous n’avons pasjugé
utile de lescorriger.
La reconstruction du tableau ne
respecte
pas tout à fait la contrainte : parexemple,
lesexportations
de Clermont versLyon,
ne sont pas les mêmesdans le sous-tableau
projeté
et dans le tableauprévu (1 ère ligne
et3ème
colonnedes tableaux 2 et
4).
Cesécarts,
de l’ordre de 4 % engénéral,
sont dus à unmanque de
précision
dans lescalculs,
certains étant effectués ensimple précision.
TABLEAU 1
Sous-tableau connu
Po
deséchanges
entresept régions
en 1974.TABLEAU 2
Projection
du sous-tableauPo
(reconstitution
à l’aide des sixcomposantes principales)
TABLEAU 3
Echanges
réalisés en 1974TABLEAU 4
Echanges prévus
à l’horizon 1974Pour
juger
de laqualité
de laprévision,
onpeut
examiner lareprésen-
tation
graphique
desopérateurs
associés aux tableauxcomplets (fig. 2).
Letableau réalisé en 1974
()
et le tableauprévu (74)
ont étéprojetés
enélément
supplémentaires
etapparaissent proches
l’un de l’autre parrapport
aux distances constatées entre les tableaux
précédents.
Certainséchanges,
nefigurant
pas dans le sous-tableaudonné,
sont bienestimés,
parexemple
lesexportations
d’Orléans vers Rennes(sème ligne, 10ème colonne),
d’autresbeaucoup
moins bien parexemple
lesexportations
de Poitiers vers Bordeaux(14ème ligne, 13 ème colonne).
La reconstruction semble toutefois satisfai-sante
globalement.
Figure 2. - Analyse des
opérateurs
de Burt associés aux tableaux:
tableau réalisé 74 : tableauprévu
4. CONCLUSION
La méthode de
prévision
d’un tableau deprobabilités
dont un sous-tableau estdonné, présentée
dans les pagesprécédentes complète
les méthodes depré-
vision basées sur des
techniques d’analyse factorielle, qui
ontdéjà
étépubliées [3] [7].
Utiliséeconjointement
avec une méthode deprévision
sous contraintes de marges, ellepermet
deprévoir
un tableau à un horizon Hdonné,
l’une ou lesmarges d’un sous-tableau étant fixées. En
général,
lesous-tableau
n’est pas exactementreconstruit,
cela n’estguère gênant
dans la mesure où il suffitpour cela de
remplacer
le sous-tableauprévu
par le sous-tableau donné une fois laprévision
du tableaucomplet effectuée.
Certaines difficultés dans lesappli-
cations
pratiques
restent àrésoudre,
dans le choix parexemple
des compo- santesprincipales
à retenir etlorsque
des termes fortementnégatifs apparais-
sent, mais laprévision
que nous avons effectuée montre que l’onpeut
aboutir à des résultats satisfaisants.ANNEXE
Tableaux
d’échanges
de blé(16 régions) Description
des donnéesLes seize
régions françaises
étudiées sont définies par l’office nationalinterprofessionnel
des céréales(ONIC).
On en trouvera une carte dans[3]
ou[8].
Dans les tableaux
d’échanges,
lesrégions
sontrangées
dans l’ordre suivant :1 Clermont 2
Dijon
3Lyon
4 Marseille5 Orléans 6 Paris 7 Rouen 8 Châlons
9
Nancy
10 Rennes 11 Nantes 12 Amiens13 Bordeaux 14 Poitiers 15 Lille 16 Toulouse Les
régions
considérées commeimportatrices
sont en colonnes et commeexportatrices
enlignes.
Le sous-tableau considéré est constitué par les
échanges
entre lessept premières régions.
BIBLIOGRAPHIE
[1] H.
L’HERMIER DES PLANTES. - Structuration des tableaux à trois in- dices de laStatistique :
théorie etapplication
d’une méthoded’analyse conjointe.
Thèse de3e cycle,
Université des Sciences etTechniques
duLanguedoc, Montpellier,
1976.[2]
H. L’HERMIER DESPLANTES,
B. THIEBAUT : Etude de lapluviosité
aumoyen de la méthode STATIS. Revue de
Statistique Appliquée,
Vol. XXVn° 2, 1977.
[3] T.
FOUCART. 2014 Sur les suites de tableaux decontingence
échelonnés dans le temps.Statistique
etAnalyse
desDonnées, n° 2,
1978.[4]
Y. ESCOUFIER. -Echantillonnage
dans unepopulation
de variables aléa- toires réelles. Thèse d’Etat. Publication de l’ISUP Vol. XIX fasc.4,
p.1-47, Paris,
1970.[5]
F.CAILLIEZ,
J.P. PAGES. 2014 Introduction àl’analyse
des données.SMASH,
1976.
[6]
P.ROBERT,
Y. ESCOUFIER. - Aunifying
tool for linear multivariate sta- tistical methods: the RV-coefficient.Applied Statistics,
25n° 3,
1976.[7] T.
FOUCART. - Prévision d’une suite de tableaux deprobabilités. Ajus-
tement à des marges données.