R EVUE DE STATISTIQUE APPLIQUÉE
T HIERRY F OUCART
Une nouvelle approche de la méthode STATIS
Revue de statistique appliquée, tome 31, n
o2 (1983), p. 61-75
<http://www.numdam.org/item?id=RSA_1983__31_2_61_0>
© Société française de statistique, 1983, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
61
UNE NOUVELLE APPROCHE
DELA METHODE STATIS
Thierry
FOUCARTLaboratoire d’Informatique et Statistique Appliquées IUT - 8P 1104 - 56008 VANNES
La méthode STATIS consiste à étudier une famille
d’opérateurs
de cova-riance ou de
produit
scalaire(opérateurs d’Escoufier)
à l’aide duproduit
scalairede HILBERT-SCHMIDT entre
opérateurs.
Ellecomporte
troisétapes :
l’étude del’interstructure, chaque opérateur
étantreprésenté
par un vecteur dans un espace euclidien et unpoint
dans lesreprésentations graphiques, l’analyse
encomposantes principales
ducompromis, opérateur qui
résume la famille en maximisant un cri- tère et lareprésentation
des intrastructures pourlaquelle plusieurs
méthodesexistent
déjà.
Nous
présentons
dans cet article une nouvelleapproche
de la méthode STATIS et proposons, pourreprésenter
lesintrastructures,
de nouvellesprocédures.
Ces dernières ont été
appliquées
àl’analyse
de trois tableaux de ratiosd’entreprises
pour étudier les
opérateurs
associés aux tableaux des données.L’interprétation
des résultats a été réalisée en collaboration avec J.GABER,
assistante à l’IUT de
Vannes, qui
s’estégalement chargée
de recueillir des données.1. METHODE
STATIS/INTERSTRUCTURE
ET COMPROMIS[1]
Nous proposons dans ce
paragraphe quelques rappels
sur la méthode STATIS etprécisons
nos notations et lelangage
utilisé.On considère une famille finie
d’opérateurs symétriques positifs {0393i}
i= 1,
kdéfinis sur un espace euclidien RP.
1.1.
Opérateur caractéristique
et interstructureNous allons définir un
opérateur caractéristique
de la famille{0393i}
i =1, k,
défini sur
Rk
defaçon analogue
à unopérateur
de covariance[2].
Soit
u E R k.
Onpeut
définirl’opérateur
u. F deRp
par :L’opérateur
u. r estsymétrique quel
que soit le vecteur u : onpeut
donc définirl’application Y, : Rk x Rk ~
R(u, v)~Rk x Rk ~ 03A3(u,v) = (u.0393) hs(v.0393)
où hs
symbolise
leproduit
scalaire de HILBERT SCHMIDT[3]
munissantl’espace
des
opérateurs
de RP d’une structure euclidienne.Revue de Statistique Appliquée, 1983, vol. XXXI, n° 2
Mots-Clés :
Espace euclidien, Analyse factorielle, Opérateurs.
62
L’application 1
est évidemment bilinéaire etsymétrique :
à tout vecteur u, onpeut
donc associer un vecteurunique
notéa(u)
tel que :Rk
étant muni duproduit
scalairecanonique.
Définition :
onappelle opérateur caractéristique
d’une famille de kopérateurs symétriques {0393i}
définis sur un espace euclidien RPl’opérateur
deRk
noté atel que :
Théorème :
l’opérateur caractéristique
estsymétrique
semi-définipositif (démons-
tration
évidente).
L’opérateur caractéristique
conduit à la notiond’interstructure ;
defaçon analogue
à la recherche descomposantes principales
d’un vecteur aléatoireX,
on détermine les
opérateurs principaux
en résolvant le programme de maximi- sation :avec itération sous contrainte
d’orthogonalité.
Définition :
onappelle opérateurs principaux
lesopérateurs Oh
h =1,
q définis surRp
par :où uh =
(u1h,....uih,..., ukh)
est le vecteur propre unitaire del’opérateur
a associé à la valeur propre
Ah
non nulle(h
variant de 1 àq).
Théorème : les
opérateurs
unitaires0’h = 0h/03BBh
forment une base ortho-normée,
du sous-espacede L(Rp) engendré
par lesystème {0393i}
i =1,
k.Conséquence :
lesopérateurs 0393i
sont les combinaisons linéaires desopérateurs
unitaires
0’h:
c’est la formule de reconstitution des données.
Définition :
onappelle
interstructure de la famille{0393i}
i =1 ,
k lespectre
deson
opérateur caractéristique.
1.2.
Compromis
Le
premier opérateur principal
vérifie les mêmes critères que lapremière composante principale
d’un vecteur aléatoire : il est de norme de HILBERT SCHMIDT maximale et maximise la somme des carrés desproduits
scalaires.Revue de Statistique Appliquée, 1983, vol. XXXI, n° 2
63 La base
canonique (ej) j
=1,
k deRk
étantorthonormée,
on a :Par définition de
l’opérateur caractéristique,
onpeut
écrire :et par
conséquent :
Le vecteur
proposé
u 1 associé à laplus grande
valeur propre maximise lepremier membre,
donc lesecond ;
d’autrepart,
lesproduits
scalaires entre lesopérateurs symétriques positifs ri
sontpositifs
ou nuls et, en vertu du théorème deFROBENIUS,
les coordonnées deul
dans la basecanonique
sont toutes de mêmesigne.
Onpeut
donc les choisirpositives,
et l’on en déduit :Théorème :
l’opérateur principal 0
=u 1.
r est unopérateur symétrique
semi-défini
positif.
Cet
opérateur
est habituellementappelé compromis.
En cequi
nous concerne,nous
préférons
le modifierlégèrement,
defaçon
que si parexemple :
on obtienne :
pour
cela,
il suffit d’effectuer une homothétie : on pose :Définition :
onappelle compromis
de la famille{0393i}
i =1,
kl’opérateur r c
définipar :
où a est le vecteur propre de
l’opérateur caractéristique
associé à laplus grande
valeur propre et dont la somme des coordonnées est
égale
à 1.Revue de Statistique Appliquée, 1983. vol. XXXI, n° 2
64
2 OPERATEUR DE COVARIANCE
[2]
Les résultats
développés
dans leparagraphe précédent
sontgénéraux ;
ilsne
dépendent
pas de la nature desopérateurs étudiés,
contrairement auxétapes
suivantes de la méthode STATIS.
On étudie une famille
d’opérateurs
de covariancelorsque
l’on est enpré-
sence d’un même vecteur aléatoire défini sur des
populations
différentes. Nous supposons cespopulations
finies.Soient
{0393i}
i =1, k
la famille desopérateurs
decovariance, {Ii}
i =1, k
la familledes
populations correspondantes
et X =(X1..., xi,... , Xp )
le vecteur aléatoireétudié.
2.1. Etude du
compromis
Le
compromis r c
= a. r estsymétrique
semi-définipositif :
c’estl’opérateur
de covariance du vecteur aléatoire X défini sur un espace
probabilisé particulier ;
on pose :
où
Pi(03C9i)
est laprobabilité (ou
lepoids)
de l’individu wi dans lapopulation Ii.
On
peut
définir sur l’ensemble{Ii}
i =1 ,
k laprobabilité PI :
Les
probabilités PI,
P etPi
sont liées par une relation deprobabilité
condi-tionnelle.
On sait que
l’opérateur
de covariance totalrT
estégal
à la somme del’opé-
ratuer de covariance interclasse
rG
et del’opérateur
de covariance interclasserI :
plus précisément
on a :Théorème : le
compromis rc
estégal
àl’opérateur
de covariance intraclasse du vecteur aléatoire X défini surl’espace probabilisé [I, F(I), P]
On supposera désormais que les variables
Xj
sont centrées surchaque
popu-lation
Ii : l’opérateur
de covariance interclasse est alors nul etl’opérateur
compro-mis est
égal
àl’opérateur
de covariance totale. Dans ce cas, ladiagonalisation
de
l’opérateur compromis
revient à l’ACP du vecteur aléatoire X défini sur[I,J (I), PJ.
2.2. Les intrastructures
[4 J
Nous allons chercher à
représenter
les variablesXj j = 1 ,
p tellesqu’elles
sont vues par
chaque opérateur ri
i =1 ,
k : onreprésente chaque
variable parRevue de Statistique Appliquée, 1983, vol. XXXI, n° 2
65 k + 1
points,
lepremier correspondant
àl’opérateur compromis
et les suivaaux
opérateurs ri
i =1,
k. Lasimple superposition
desreprésentations phiques
obtenues par lesanalyses
encomposantes principales
desopérateurs
est difficilement
interprétable, puisque
les axes ne sont pas les mêmes.La base orthonormée du sous-espace
engendré
par les variablesXj
que neconsidérons est constituée par les
composantes principales
réduites du comprorron note :
Ch
h =1,
q : lescomposantes principales
ducompromis
uh les vecteurs
principaux Àh
les valeurs propres.on a donc :
’
Les
composantes principales
réduites sont :dans
l’analyse
encomposantes principales
ducompromis,
les coordonnées des va-riables sont les covariances avec les
composantes principales
réduites calculées surla
population
1 : nOn
peut
estimer les covariances entre les variablesXj
et lescomposantes princi- pales C’h
en considérant leurs restrictions auxpopulations Ii ;
on pose :sur la
population Ii,
on a :et par
conséquent :
Dans le cas où
ri
estégal
àl’opérateur r c
etIi
àI,
on retrouve la formuleclassique
de reconstitution des données. A
partir
de lahe composante principale
du compro-mis,
onreprésentera
donc la variableXj
par les k + 1points
de coordonnées :Les "déformations" de
Xj
dansIi
sont dûes àplusieurs
facteurs :- le
changement
des corrélations entre les variables.- la "déformation" des
composantes principales
ducompromis
parIi.
Le
premier
facteur est celui que nous voulons mettre en évidence. Le second vient du fait que lescomposantes principales C1 h
ne sont niréduites,
ni non cor-Revue de Statistique Appliquée, 1983. vol. XXXI. n° 2
66
rélées sur
chaque population Ii :
leuremploi
estjustifié
par lespropriétés
del’opé-
rateur
compromis
citéesplus
haut et par le théorème suivant :Théorème : la variable
Xj
est la moyenne des variablesXij
i =1, k j = 1 ,
p pon-dérées par les coefficients
ai
i =1, k.
Ce théorème résulte de la définition del’opérateur compromis.
Représentation
descomposantes principales
La démarche
précédente peut
être utilisée pourreprésenter
toute combinai-son linéaire des variables
Xj
=1, p :
onpeut
doncreprésenter
lescomposantes principales
ducompromis
déformées" par lapopulation Ii :
en les notantC m 1
on a les formules ci-dessous :
Définition:
onappelle
intrastructures d’une familled’opérateurs
de covariance{0393i}
i =1,
k l’ensemble des,variables et descomposantes principales
du compro-mis reconstruites par
chaque opérateur ri.
On
peut également
s’intéresser auxcomposantes principales
dechaque population,
maisl’interprétation
des résultats se révèle dans lapratique
assezdélicate.
3. OPERATEURS DE PRODUIT SCALAIRE
On étudie une famille
d’opérateurs
deproduit
scalaire(plus
connus sous lenom
d’opérateurs d’Escoufier) lorsque
l’on est enprésence
deplusieurs
vecteursaléatoires
Zi,..., Zj,... , Zk
à valeurs dans les espaces euclidiensRP 1,
... ,Rpj,..., RPk,
et définis sur une mêmepopulation
1 que l’on supposera finie etmunie
d’uneprobabilité
P.Chaque vecteur Zj
définit unopérateur nj
del’espace L2(I)
et l’on noteIIi
leproduit
scalaire définisur
RPJ.3.1.
Interprétation
ducompromis [5]
Soit
ne
= a. SZ lecompromis
de la famille{03A9j} j
=1 ,
k : cetopérateur
est
symétrique,
semi-défini etpositif:
ilpossède
toutes lespropriétés
d’unopé-
rateur et nous savons
qu’en fait,
c’estl’opérateur
d’un vecteur aléatoire Z[5].
On pose :
Revue de Statistique Appliquée, 1983, vol. XXXI, n° 2
67 Le vecteur aléatoire Z est à valeurs dans
l’espace
vectorielRP,
surlequel
on définitla
métrique
n :On note : n
= ~03B103A0j
Théorème :
l’opérateur compromis 03A9c
estl’opérateur
deproduit
scalaire du vecteur aléatoire Z défini sur 1 et à valeurs dansl’espace
euclidien RP muni de la mé-trique
n.L’analogie
avec leproblème précédent
est évidente :- à la
juxtaposition
des individusrepérés
par les mêmes variables accompa-gnée
d’une définitionappropriée
de laprobabilité
sur l’ensemble 1 obtenu cor-respond l’opérateur
de covariance.- à la
juxtaposition
des variablesaccompagnée
d’une définitionappropriée
k
d’une
métrique
surRp correspond l’opérateur
deproduit
scalaire03A9c = 03A3 ai ni
j=i
3.2. Intrastructure
[6]
Comme dans le cas d’une famille
d’opérateurs
decovariance,
nous allons cher- cher àreprésenter chaque
individu w par k + 1points,
lepremier correspondant
aucompromis
et les suivants auxopérateurs nj.
Plusieurs
procédures
existentdéjà
ou sont en train d’être mises aupoint [6].
Celles que nous proposons consistent à reconstruire lescomposantes principales Ch
h =1,
q ducompromis
parchaque
vecteurZj j = 1,
k : lareprésentation graphique
àlaquelle
on aboutit met en évidence lespertes
d’informations surchaque
individulorsque
l’on se restreint à un vecteurZj.
i)
On noteC’m,j i = 1,k
m =1, qj
lescomposantes principales
réduitesdu vecteur aléatoire
Zj.
On reconstruit lescomposantes principales Ch
par la for- mule de reconstitutions des données :Il n’existe aucune raison pour que la reconstruction soit exacte, même
lorsque
toutes les
composantes principales C’m,j
deZj
sontprises
encompte, puisque
la
variable aléatoireCh
est combinaison linéaire de toutes les variablesXhjj j = 1,k hj = 1, pj.
A un individu ca sont associés k + 1 vecteurs de Rq
(q
étant le nombre de compo- santesprincipales
ducompromis) :
- le
premier
est obtenu directement dene :
Revue de Statistique Appliquée, 1983, vol. XXXI, n° 2
68
- les suivants
correspondent
auxopérateurs 03A9j :
On peut
envisager
dereprésenter
des individussupplémentaires,
dont les valeurs ne sont pas toutes connues parexemple,
ouqui
caractérisent lescomposantes princi- pales
dechaque opérateur ; j
et m étant fixés on considère l’individu e défini par :Cet individu
engendre
le me axeprincipal
du tableauZj.
ii)
Onpeut
aussiprocéder
de lafaçon
suivante : on sait que lacomposante principale Ch
est vecteur propre del’opérateur compromis
associé à la valeurpropre
Àh :
.De la même
façon
que dans le cas desopérateurs
decovariance,
onremplace ne
par
03A9j, j
=1 ,
k pour trouver : 1Lorsque
l’on utilise cetteprocédure,
on aboutit à lapropriété
suivante :Théorème :
lacomposante principale Ch
est la moyenne descomposantes prin- cipales Cj h pondérées
par les coefficientsaj j - 1 ,
k.On
peut
mettre en évidence la différence entre les deuxméthodes ; l’opéra-
teur
S2j
estégal
à la somme desprojecteurs Pm,j
sur les espaces propresengendrés
par les
composantes principales Cm
deZj
etpondérés
par les valeurs propres associéesÀm,j :
on en déduit :
et enfin :
cette dernière formule fait intervenir de
façon explicite
les valeurs propres del’opérateur 03A9j.
4. APPLICATION
L’application
que nousprésentons
ci-dessous concerne trois tableaux de données définis par les mêmes individus et les mêmes variables et échelonnéssur trois ans.
Après
avoirprécisé
cesdonnées,
nousinterprétons
les résultats desanalyses
desopérateurs
de covariance et desopérateurs
deproduit
scalaire.Revue de Statistique Appliquée, 1983, vol. XXXI. n° 2
69 4.1. Les données étudiées
Les individus sont définis par un échantillon de 45
entreprises
bretonnesqui
ontdéposé
leur bilan entre les années 1971 et 1980. Parmielles,
une moitiéenviron ont été mises en
liquidation judicaire (disparition
del’entreprise)
alorsque les autres ont bénéficié d’un
règlement judiciaire (sauvetage
del’entreprise).
Cette information est connue pour
chaque entreprise,
mais n’a pas étéprise
encompte
dans lesanalyses (c’est l’objet
d’un travailultérieur).
Lesentreprises
sontcodées de 01 à 53 la lettre E
(échec: disparition
del’entreprise)
ou R(réussite:
sauvetage) complétant
l’identificateur. Certains codescorrespondent
à des entre-prises qui
ont été écartées des tableaux à cause de leurs résultatsaberrants ;
il nefigurent
pas dans la liste.A
partir
des bilansannuels,
un certain nombre de ratios ont été calculés.Parmi eux nous avons retenu les huit suivants : Ratios
d’équilibre
de bilan ou de structureSOL :
capitaux propres/dettes totales ;
LQG : capitaux circulants/dettes
à court terme ;TRL : valeurs réalisables et
disponibles/dettes
à court terme ;RFR : fonds de
roulement/passif.
Ratios de
gestion
ATF :
cash-flow/dettes totales ;
FIN : frais
financiers/chiffres d’affaires ;
RVA : frais de
personnel/valeur ajoutée.
Ratio de rentabilité
REN : résultat
d’exploitation/chiffre
d’affaires hors taxes.La valeur
ajoutée
a été calculée suivant la définition donnée dans l’ordon-nance du 17 août 1967 sur la
participation
des travailleurs aux fruits del’entreprise.
4.2.
Analyse
desopérateurs
de covariance : interstructure.L’analyse
desopérateurs
de covariancecomporte
troisétapes.
Enfait, après
avoir étudié
rapidement
l’interstructure dont l’intérêt est limité par lepetit
nombrede
tableaux,
nousinterprèterons
lesreprésentations graphiques
simultanées aucompromis
et des intrastructures.Le schéma c-dessous
représente
l’interstructure de la famille définie par les troisopérateurs
de covariance :Interstructure des
opérateurs
de covariance.Revue de
Stanstique
Appliquée, 1983, vol. XXX), n" 270
La
première propriété qui apparaît
est un échelonnementchronologique
le
long
de l’axe 2. Nous nousgarderons
bien del’interpréter
immédiatementpuique,
par unsimple tirage
auhasard,
laprobabilité
d’un tel échelonnement est de1/3.
Par contre, le décrochement dupoint COV 2, qui représente l’opérateur
de covariance 2 années avant le
dépôt
de bilan estsignificatif :
la norme de cetopérateur
est nettementplus
faible que celle des deux autres.Reprenons
un peu cette notion de norme. Lamétrique
sur RP étantcanonique l’opérateur
de cova-riance r a pour matrice la matrice de covariance V :
Le carré de la norme est défini par :
Ip ili étant
le coefficient de corrélation entre les variablesXi
etXj .
, Compromis et intrastructures des covariances
Revue de Statistique Appliquée, 1983. vol. XXXI. n° 2
71 La
petitesse
de la norme del’opérateur
COV 2s’explique
donc par une dimi- nution des covariances entre les différentes variables ou, cequi
estéquivalent
sousl’hypothèse
de l’invariance descorrélations,
par une diminution des variances.Cette dernière
interprétation
est laplus vraisemblable,
étant donnée laproximité
de
l’opérateur
COV 2 et del’opérateur compromis qui
est-rappelons-le-
définipar le
1er
axe dans l’interstructure(nous
verrons d’ailleursqu’elle
est confirméepar l’étude des
intrastructures).
Cette diminution des variancessignifie
que, dans le tableau des ratios 2 années avant ledépôt
debilan,
lesentreprises
sont moinsdispersées
que dans les deux autres ; à ceniveau,
lapoursuite
del’interprétation
est
délicate, compte-tenu
des données : ce resserrement desentreprises
est-il dû auxvariances interclasses - les 2 classes étant définies par les
entreprises disparues
etsauvées - ou aux variances intra-classes ? On ne
peut répondre
à cettequestion
en se bornant aux résultats
précédents.
4.3. Intrastructures et
compromis
Le schéma ci-dessus donne les
représentations
des variables sur leplan
en-gendré
par les deuxpremières composantes principales
ducompromis.
Sur lacomposante principale C’ h (h
= 1 ou2),
la variableX.
dans le groupei (1
i3)
est,
rappelons le, représentée
parcouvi. (X. , C’h) (cf. § 2.2).
Les notations sontfaciles : à l’identificateur du ratio on
ajoute 1, 2
ou 3 suivantqu’il sagit
del’opéra-
teur COV
1,
COV 2 ou COV 3.Les deux
premières composantes principales expliquent
80 % de la variancetotale il n’est donc pas étonnant que les variables soient bien
représentées
sur leplan
sauf l’une d’entre elles : FIN.Les résultats concernant ce ratio sont d’ailleurs
surprenants :
il n’est corrélé à aucune desquatre premières composantes principales
et varie donc defaçon
àpeu
près indépendante
de l’ensemble des autres.Or,
sur leplan gestion,
il est donnécomme indicateur de l’état de santé d’une
entreprise, qui, lorsqu’elle
marchemal,
doit
supporter
des frais financiers élevés. Parailleurs,
on constate en examinant lesmatrices des
opérateurs
que les covariances de ce ratio avec toutes les autres variables sonttoujours
très faibles(il
n’en est pas de même descorrélations) :
savariance étant en
particulier
trèspetite,
son influence dansl’analyse
en est d’autantréduite,
et celasuggère
d’étudier les corrélationsplutôt
que les covariances dans laprochaine
étude.On
peut interpréter
en deuxtemps
lesreprésentations graphiques
des autresvariables. Tout
d’abord, l’analyse
encomposantes principales
ducompromis
metbien en évidence les
propriétés
des ratios que nous avons définisprécédemment.
Les ratios
ATF,
REN et SOL varient en sens inverse du ratio RVA de valeurajoutée,
cequi s’explique
par lecompte
"résultatd’exploitation" : lorsque
ce der-nier
diminue,
le ratio REN diminue et le ratio RVAaugmente ;
il suffit pour cela de considérer leurs définitions :REN = résultat
d’exploitation/chiffre
d’affairesRVA = frais de
personnel/valeur ajoutée.
REN est donc une fonction croissante alors que RVA est une fonction décroissante du résultat
d’exploitation qui
est inclus dans la valeurajoutée. L’opposition
du ratioATF au ratio RVA
s’explique
de la mêmefaçon.
L’opposition
entre les ratios de solvabilitéLQG,
TRL et RFR et le ratioRVA est
beaucoup
moins nette ; les corrélations sont toutefoisnégatives,
alorsqu’elles
sontpositives
avec les ratios de rentabilité.Revue de Statistique Appliquée, 1983, vol. XXXI. n° 2
72
On
peut
conclure cetteinterprétation typique
del’analyse
encomposantes principales
en donnant un sens aux axes : lepremier (axe
vertical duschéma) représente
en faitl’équilibre
du bilan desentreprises ;
c’est suivant ce caractèrequ’elles
sedistinguent
leplus
les unes des autres. Le second met en cause desratios concernant la
gestion
desentreprises.
La deuxième
étape
de notreinterprétation
consiste à étudier les intra- structures : elle estcaractéristique
de la méthode STATIS.La
première
constatation est évidente : lespoints représentatifs
d’une mêmevariable associés aux
opérateurs
COV1,
COV 2 et COV 3 restent biengroupés
autour du
point représentatif
associé aucompromis (qui
est lepoint moyen).
On en déduit que les ratios définis par
chaque opérateur présentent
lesmêmes
propriétés générales.
On constateégalement
que lespositions
des variablesLQG 1, LQG 2, LQG
3 autour deLQG
parexemple correspondent
exactement auxpositions
de SOL1,
SOL 2 et SOL 3 autour de SOL. C’est même presquetoujours
le cas : une rotation-homothétie
unique permet
de superposer les variables(sauf
leratio
RVA)
del’opérateur
COV 3 avec les variablescorrespondantes
del’opérateur
COV
2 ;
il en est de même pour COV 2 et COV1,
l’homothétie étant semble-t-il derapport
inverse. Cettepropriété
est très intéressante car ellepermet
d’affirmer que l’ordrechronologique
obtenu sur l’interstructure n’est pas dû à un facteuraléatoire, puisqu’on
le retrouve au niveau dechaque variable,
et que lesangles
entre les ratios d’un même tableau restent à peu
près
constants, donc leurs corré- lations : nousjustifions
icil’hypothèse
faite dans l’étude de l’interstructure etd’ailleurs,
l’étude des intrastructures montre bien que la variance des ratios estbeaucoup plus
faible deux années avant ledépôt
de bilan : cette variance est eneffet donnée par le carré de la distance du
point représentatif
àl’origine
des axes.Nous ne pouvons aller
plus
loin dansl’interprétation
avec les résultats établis :l’analyse
neprend
pas encompte
en effet les deux groupesd’entreprises,
mais ilsemblerait, d’après
l’étude des moyennes, que la variation des variances soit due à la variation des variances interclasses.4.4.
Analyse
desopérateurs
deproduit
scalaireLes
entreprises
dechaque
tableau étant lesmêmes,
nous avons effectuél’analyse
desopérateurs
deproduit
scalaire. Les deuxanalyses
ne sont paséquiva-
lentes
puisque
unepermutation
des individus dans un tableau ne modifie pas les covariances.En ce
qui
concernel’interstructure, l’interprétation
est la même que laprécédente :
l’ordrechronologique
n’estsignificatif
que si un certain nombred’entreprises
lerespecte,
cequi
sera confirmé. La diminution de la norme du deuxièmeopérateur
caractérise la diminution desproduits
scalaires entreindividus,
ou de leur norme : on retrouve exactement la même
propriété
que sur les cova-riances et variances.
Le
graphique ci-joint représente
leplan principal
des deuxpremières
compo- santesprincipales
ducompromis,
surlequel
on étéplacés
lespoints représentatifs
des
individus,
suivant la deuxième méthodeexposée
dans leparagraphe
3.2. Commeun individu est
représenté
par 4points,
certains sont absents de lareprésentation graphique (en
cas depoint double,
seul l’identificateur dupremier
individu ren-contré dans la liste
indiqué
sur leschéma).
Revue de Statistique Appliquée, 1983, vol. XXXI, n° 2
73 Interstructure des
opérateurs
de produit scalaire.La
représentation graphique
despoints
définis par lecompromis
est celled’une
analyse
encomposantes principales.
Elle met surtout en évidence les entre-prises
dont lesratios,
au cours des troisannées, prennent
des valeursparticulières :
leurs
points représentatifs
sontéloignés
du centre degravité
du nuage et l’onpeut
opposer deux groupesd’entreprises : 48E, 23R, 15E, 11 E,
21E d’unepart
et50E, 05E, 46E, 24E,
26R d’autrepart.
Onpeut
remarquer que ces casparticuliers
sontsurtout des
entreprises qui disparaîtront
définitivement. Pourinterpréter
les axesà l’aide de ces deux groupes
d’individus,
il faudrait examiner les données initiales.Ce n’est pas notre but dans cet article.
La
représentation graphique
des intrastructures nousapporte
des informa- tions intéressantes. Toutd’abord,
elleprécise
laparticularité
de certaines entre-prises :
laposition
dupoint
48Es’explique
par des ratios trèsparticuliers
de l’entre-prise correspondante
dansl’opérateur
SCA 3(le point
48E estbarycentre
de48E
3,
48E 2 et 48E1).
Mêmeexplication
despositions
despoints 23R, 15E,
11 E.L’entreprise
21 E se différencie de ce groupepuisque
c’est la seule dont laposition
dupoint représentatif
sur le schémas’explique
par des ratiosparticu-
liers dans
l’opérateur
SCA 1. Le deuxième groupe se scinde en deux : les trois entre-prises 50E,
OSE et 46E ont des ratiosparticuliers
danschaque
tableau alors que les deux autres : 26R et 24E se différencient surtout dansl’opérateur
SCA 1.Cette
représentation graphique
met en évidence aussi despropriétés géné-
rales : les
points représentatifs
desentreprises
dansl’opérateur
SCA 2n’apparais-
sent pas sur le schéma : cela est dû à leur concentration autour du centre de
gravité
et
correspond
à la diminution de la variance des ratios dansl’opérateur
COV 2.Autre caractère
général :
on retrouve la mêmepropriété
d’homothétierotation,
et lespoints représentatifs
d’une mêmeentreprise
se suivent autour du centre degravité
dans le sens desaiguilles
d’une montre ; lelong
de lapremière bissectrice,
on trouve les
entrerpises
caractérisées par leurs ratios à la fin de lapériode (opéra-
teur SCA
1)
alors que lelong
de latroisième,
on trouve les mêmesentreprises
mais caractériées par leurs ratios au début de lapériode (opérateur
SCA3).
Le
compromis
donne toute l’informationclassique
d’uneanalyse
en compo- santesprincipales :
groupes devariables, interprétation
des axes, groupes d’individuslorsqu’il s’agit d’opérateurs
d’Escoufier. Ilpermet
depositionner
despoints
caracté-risant les variables ou les individus des
opérateurs
de la famille et derépondre
avecprécision
auxquestions qui
ont étéposées
lors de l’étude de l’interstructure. Il met en évidence les éléments d’évolutionparticulière
et c’est auspécialiste
de reveniraux sources pour une étude
plus approfondie.
Revue de Statistique Appliquée, 1983, vol. XXXI, n° 2
74
Compromis et intrastructures des produits scalaires
5. CONCLUSION
L’application
de la méthode STATIS que nous avons réalisée et dont nous avonsinterprété
les résultats dans les pagesprécédentes
met en évidence un certainnombre
d’avantages.
En
effet,
les résultats que nous avons obtenus sont facilementinterprétables :
l’interstructure décrit les
opérateurs
dans leur ensemble et lecompromis
et les intra-structures détaillent les
propriétés
dechaque
variable ou individu.L’interprétation
est
analogue
à celle d’unanalyse
encomposantes principales,
etl’analyse
réaliséemontre bien le lien entre l’interstructure et les
intrastructures,
lapropriété barycen- trique
de ces dernières étant issue de lapremière.
On
peut
voir un autreavantage
à la méthode STATIS tellequ’elle
estexposée
dans cet article : nous avons
proposé
unereprésentation
des intrastructuresqui
ne nécessite pas la
diagonalisation
dechaque opérateur,
cequi
réduit très sensible- ment letemps
de calcul en ordinateur. Précisions dans le même ordre d’idée que lelogiciel
existe en BASIC sur uneconfiguration
à base de TRS 80 Model 1.Revue de Statistique Appliquée, 1983, vol. XXXI, n° 2
75 Nous terminerons la conclusion par une
question :
dansl’exemple traité,
les tableaux ont mêmes individus et mêmes variables.Quelle
est la liaison entre lesopérateurs
de covariance et lesopérateurs
deproduit
scalaire ?Puisqu’il
n’existepas de relation fonctionnelle entre les deux familles
d’opérateurs,
onpeut
envi- sager de mesurer la liaison en calculant le cosinus desopérateurs caractéristiques
desfamilles,
mais il reste à en déterminer lespropriétés
pourpouvoir l’interpréter.
BIBLIOGRAPHIE
[1] Y.
ESCOUFIER. -Opérateur
associé à un tableau de données. Annales del’INSEE, n° 22-23,
Paris 1976.[2]
J.C. DEVILLE. 2014 Méthodesstatistique
etnumériques
del’analyse
harmo-nique. Annales de l’INSEE, n° 15,
Paris 1974.[3]
L. SCHWARTZ. -Analyse
hibertienne.Hermann,
coll.Méthodes,
Paris 1979.[4]
H. L’HERMIER DES PLANTES. - Structuration des tableaux à trois indices de lastatistique.
Thèse 3ecycle,
Université des Sciences ettechniques
duLanguedoc, Montpellier
1976.[5]
P. CAZES et al. -Codage
etanalyse
des tableauxlogiques -
introduction àla pratique
des variablesqualitatives.
Cahiers du BURO sérieRecherche, n° 27,
Paris 1977.[6]
B. ESCOFIER et J. PAGES. -Comparaison
de groupes de variables définiessur le même ensemble d’individus.
Rapport IRISA, n° 166,
Mai1982,
Rennes.
Revue de Statistique Appliquée, 1983. vol. XXXI, no 2