R EVUE DE STATISTIQUE APPLIQUÉE
P H . C ASIN
J. C. T URLOT
Une présentation de l’analyse canonique généralisée dans l’espace des individus
Revue de statistique appliquée, tome 34, n
o3 (1986), p. 65-75
<http://www.numdam.org/item?id=RSA_1986__34_3_65_0>
© Société française de statistique, 1986, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
65
UNE PRESENTATION DE L’ANALYSE CANONIQUE GENERALISEE DANS L’ESPACE DES INDIVIDUS
Ph. CASIN
(1)
et J.C. TURLOT(2)
(1)
Docteur 3e cycle Université de Strasbourg I(2) Ingénieur CN.R.S.
Centre d’études statistiques I.R.M.A., Strasbourg I
Nous tenons à remercier tout particulièrement Monsieur Michel TENENHA US, Professeur
associé au CE.S.A., pour les conseils, critiques et suggestions qu’il nous a adressés lors de l’élabo- ration de cet article.
RÉSUMÉ
Nous montrons que l’analyse canonique généralisée de CARROLL est une analyse discri- minante et nous discutons de certaines conséquences de ce résultat.
SUMMARY
We prove that CARROLL’S generalized canonical analysis is a discriminant- analysis and
we examine some consequences of this result.
Mots-clés :
Analyse canonique généralisée, Analyse canonique, Analyse
discri-minante.
1. INTRODUCTION
L’analyse canonique généralisée (A.C.G.) -
au sens de J.D. CAR-ROLL [1] -
admet pour casparticuliers
toutes les méthodesd’analyse
desdonnées
usuelles, qu’elles
soient «explicatives »
comme larégression simple
ou
multiple, l’analyse
de variance ou decovariance, l’analyse discriminante,
ou «
descriptives »
commel’analyse canonique simple, l’analyse
des corres-pondances simples
oumultiples
oul’analyse
en composantesprincipales (A.C.P.)
normée.Après
avoirrappelé
lesprésentations
traditionnelles de l’A.C.G. dansl’espace
des variables et dansl’espace
des facteurs(§ 2),
nous montrons que l’A.C.G. est uneanalyse
discriminanteparticulière :
lesreprésentations
gra-phiques
que l’on obtient alorspermettent
uneanalyse plus
fine des résultats(§ 3)
etcoïncident,
dans les casparticuliers
de l’A.C.G. lesplus
courants, avecles
représentations
utilisées habituellement. Cetteprésentation
de l’A.C.G.permet, d’autre
part,
de reconsidérer les relations existant entre les différentesRevue de Statistiques Appliquées, 1986, vol XXXV, n°3 3
66
techniques d’analyse linéaire,
etapporte
unéclairage
nouveau de certaines de leurspropriétés (§ 4).
Enfin,
on décrit unalgorithme
de calcul et lesprincipaux
résultatsnécessaires à
l’interprétation
d’une A.C.G.(§ 5).
2. RAPPELS SUR L’ANALYSE
CANONIQUE
GENERALISEEa. Position du
problème,
notationsOn
dispose
de p groupes deqj(1 j p)
variablesnumériques
ouqualitatives;
soitXj
le tableau dont leslignes
sont les observations de n individus sur ces qj variables.Xj
est un tableau de dimensions n x m j(mj peut
être différent de qj,chaque
variablequalitative
étantremplacée
dansXj
parses variables
indicatrices).
On note X =
[X 1 , ..., Xp]
lajuxtaposition
des p tableaux. X est dep
dimensions n x m, où
m
mj ;enfin,
on suppose - sansperdre
engénéralité -
quechaque
tableauXj
est de rang mj et que les variablesnumériques
sont centrées. DansRn,
muni de lamétrique diagonale
despoids
des individus
Dp,
les mj colonnes du tableauXj engendrent
un espace dedimension m, , noté
Wj.
L’A.C.G.,
au sens de CARROLL[1],
se propose de « résumer »chaque
groupe de variables par une variable
unique Z1j
EW, (1 j p)
et dechercher une variable auxiliaire
Z’
de manière à rendre maximale laquantité
p
03A3 R2(Z1, Zj) ;
ainsiZ’
est la variable laplus
liée en moyenne à chacun des groupes devariables,
l’intensité de la liaison étant mesurée par le carré ducoefficient de
corrélation linéaire entreZ’
etZ1J(1 j p).
b. La solution dans
l’espace
des variablesPour Z e Rn
donné,
le maximum deR2(Z, ZJ)
est atteintlorsque zj
coïncide avec la
projection Dp-orthogonale
de Z surWj (CARROLL [1]);
ils’ensuit que si on note
Pj l’opérateur
deDp-projection
surWj,
on a :Z’
etZlj
sont définis à une constantemultiplicative près; Z’
est choisieDp-normée
à 1 et on retiendra pourZlj
la variable deWj
obtenue parprojection orthogonale
deZl
surWj.
Revue de Statistiques Appliquees, 1986, vol XXXV, no 3
67 De la relation :
p
on déduit que
Zi
est le vecteur proprede 1 Pj
associé à saplus grande
valeurpropre.
Plus
généralement, Z’
est solution de :sous les contraintes :
P
Z’
est alors le vecteur proprede 1 Pj
associé à sai-ème
valeur propre :j-l
( i11Pi), somme d’opérateurs symétriques
semi-définis positifs
est symétrique
semi-défini
positif
etpossède
n valeurs propres réellespositives
ou nulles.c. La solution dans
l’espace
des facteursLes
composantes canoniques Z’
du tableau Xpeuvent
être déduites de ladiagonalisation
d’unopérateur
de dimension m(SAPORTA [13]).
En
effet,
si on note
diag Vxx
la matrice m x m suivante :Posons
Vxx
est, parconséquent,
la matrice m x mcomportant p2 blocs,
et dont le blocRevue de Statistiques Appliquees, 1986, vol XXXV, n° 3
68
on
obtient,
enmultipliant
àgauche
les deux membres del’équation
par X :Xb’
s’identifie parconséquent
avec lacomposante canonique
d’ordrei, Z’,
et
b’
constitue lei-ème
facteur de l’A.C.P. deX,
Rm étant muni de lamétrique (diag Vxx)-’.
Onpeut
alors décrire l’A.C.G. par le schéma de dualité suivant :d. La nécessité d’une
approche
différenteConsidérer l’A.C.G. comme une A.C.P. dans
l’espace
des individus muni de lamétrique
de MAHALANOBIS par blocs ne fournit pas derègles d’interprétation
de laconfiguration
des individus sur les axesprincipaux.
Nous allons montrer dans le
paragraphe
suivant que l’on peutprésenter
l’A.C.G. d’une manière moins abstraite dans
Rm,
comme le résultat de la maximisation d’un critèresimple,
cequi permettra
dedégager quelques principes d’interprétation
des résultats.3. L’ANALYSE
CANONIQUE GÉNÉRALISÉE
EST UNE ANALYSE DIS- CRIMINANTEa. Position du
problème,
notationsSoit G le tableau suivant :
Le tableau X
(n
xm)
décrit dans Rm un nuage depoints N;
si on supposeque R’ est muni de la
métrique
euclidienneusuelle,
l’écriture de G revient à considérer lesprojections orthogonales
de N sur chacun des sous-espacesRevue de Statistiques Appliquees, 1986, vol XXXV, no 3
69
engendrés
par les variables des différentstableaux,
c’est-à-dire les individus telsqu’ils
sont décrits parchaque
groupe de variables. On noteNj
le nuage des individus décrits par le tableauXj. (Il s’agit
d’uneprésentation classique
que l’on trouve notamment dans ESCOFIER et PAGES[5],
GLACON[6]).
La matrice des
poids
des np individus considérés est la matriceDt
suivante :
Si on cherche à déterminer les directions selon
lesquelles
les nuagesNj
sont lesplus ressemblants,
il est naturel de désirer que les pprojections
sur un axe Ade Rm du même individu décrit selon les p tableaux soient
proches
les unes desautres et que les n groupes ainsi constitués soient le
plus
distinctspossible.
Ceproblème
est résolu defaçon classique
parl’analyse
factorielle discriminante.b.
Equivalence
entreanalyse canonique généralisée
etanalyse
discriminanteL’équation
dedécomposition
de la variance :VT = VE
+ VIVT,
VE etVI désignant respectivement
les matrices de variancetotale,
entre lesclasses et à l’intérieur des
classes,
s’écritici, puisque 1/p
X est le tableau des coordonnées des centres degravité :
On a, par
conséquent :
L’axe
A,
de vecteur directeurul,
satisfait au critère énoncé ci-dessus sia une valeur maximale.
Revue de Statistiques Appliquees, 1986, vol XXXV, n° 3
70
u’, premier
vecteur propre deVT ’ VE
s’identifie aupremier
facteurcanonique (à
une normalisationprès)
et les contraintesd’orthogonalité
sur lesfacteurs discriminants
successifs,
8j désignant
lesymbole
deKRONECKER,
sontéquivalentes
aux contraintessur les facteurs
canoniques :
Ainsi,
l’A.C.G. est uneanalyse discriminante,
oùchaque
individu consti- tue une classe dont les éléments sont lesdescriptions
de l’individu par les ptableaux;
ce résultat est leprolongement
del’approche
de l’A.C.G. en « termesd’analyse
de la variance »proposée
parSAPORTA [13].
Remarques
1)
Lesprincipaux
calculs nécessaires àl’interprétation
d’une A.C.G.peuvent
ainsi être effectués au moyen d’un programmed’analyse
discriminante(ROMEDER [12],
parexemple).
2)
L’A.C.G. de Xpeut
aussi êtreprésentée
commel’analyse canonique
de G et A dans R"P
où
In désigne
la matrice identité d’ordre n.3)
Les valeurs propres de l’A.C.G. sont despouvoirs
discriminants.c. Les
représentations
associées àl’analyse
de GEn
analyse discriminante,
on est amené àreprésenter
simultanément les centres degravité
des classes(en projection
sur lesaxes),
c’est-à-dire1/p Xb’,
et les np
points
par leurs coordonnées sur les axesfactoriels,
c’est-à-direGb’.
Or:
car :
Z; - Ài Xj bj (MASSON [9],
SAPORTA[13] )
bj désignant
le bloc deb’
relatif auj-ème paquet
de variables.Cette
représentation revient,
en termesd’A.C.G.,
à superposer les1/03BBi
7,’, j
=1,
..., p et1 /p Z’ (qui
estégal
à1 /p Xb’ )
etpermet
de mettre en évidence lesproximités
entre les différentesdescriptions
desindividus,
selon les ptableaux;
parrapport
auxgraphiques
habituellementproposés
enA.C.G.,
ondispose
de deuxtypes
d’informations utiles :Revue de Statistiques Appliquees, 1986, vol XXXV, nO 3
71
i)
Si on ne tientcompte
que des centres degravité,
on est réduit à nedonner
qu’une interprétation unique
des axesfactoriels;
or lepoint
de vue del’A.C.G. est très différent : il
s’agit d’interpréter
chacune des variablesZJ,
j = 1,...,
p,l’interprétation
de la variable auxiliaireZ’ qui n’appartient généra-
lement à aucun groupe de variables et
qui
n’est pas forcément lapremière composante principale
desZi,
1j
p, étant délicate et de peud’importance.
ii)
Ladispersion
desprojections
des p observations d’un individu autour de leur centre degravité permet
de mettre en évidence lespoints
« aberrants » ;si un groupe a en
projection
une variance trèssupérieure
à celle des autres groupes, l’individucorrespondant
a uncomportement particulier
vis-à-vis desliaisons étudiées.
Remarque
Les variables
Gb’,
i =1, ...,
m, étant issues del’analyse canonique
de Get A dans Rnp sont deux à deux
D*-orthogonales,
cequi permet
de retrouver lapropriété
d’«orthogonalité
faible » deszj (DEVILLE
etSAPORTA [4]) :
4. UNE
PRÉSENTATION
DES CAS PARTICULIERS DE L’A.C.G.a. Les cas
particuliers
de l’A.C.G.Dans ce
quatrième paragraphe,
nous examinerons successivement lesreprésentations
obtenues pour les différentes méthodesclassiques d’analyse
des
données, quand
on les considère comme des casparticuliers
de l’A.C.G.(ou,
cequi
estéquivalent,
del’analyse discriminante),
selon les schémas suivants :i) Variables quantitatives ii) Variables qualitatives
Les résultats de
l’analyse
d’un tableau X par une méthode située àl’origine
d’une flêche peuvent aussi être obtenus par la méthode située à l’extrémité de la même
flèche,
les différentssigles
utilisésdésignant respectivement :
Revue de Statistiques Appliquees. 1986, vol XXXV, n°3 3
72
A.F.C.M. :
analyse
factorielle descorrespondances multiples
A.F.C.
: analyse
factorielle descorrespondances simples
A.F.D.
: analyse
factorielle discriminante A.C.: analyse canonique simple
A.C.P.
: analyse
encomposantes principales
A.C.G.
: analyse canonique généralisée
On notera, en
particulier,
les résultats suivants peu connus :i) L’analyse canonique
est uneanalyse
discriminante.ii)
L’A.C.P. normée est un casparticulier
del’analyse canonique simple
et del’analyse
discriminante.b.
L’analyse canonique
etl’analyse
descorrespondances simples
Dans le cas de
l’analyse canonique,
ondispose
de deux ensembles de variables Xi et X2engendrant
dans Rn deux sous-espaces W, et W2 de dimensionsrespectives
mi et m2. Si(Si, 82) représente
lei-ième couple
canoni-que, associé à la valeur propre ri, on montre
(KETTENRING [8],
SAPORTA[13])
que la valeur propreÀ,
et la variablecanonique Z’,
au sens deCARROLL,
sont obtenues ainsi :
En
pratique,
on ne s’intéresse auplus qu’à l’interprétation
des inf(mi, m2) premiers
facteurs.Selon la
présentation
donnée de l’A.C.G. auparagraphe précédent,
onreprésente
simultanémentZ’,
PlZ’
et P2 Z’(à
une homothétieprès),
soit :Z’, S’i
et
S2.
Dans le cas del’A.F.C.,
les deux variables considérées sontqualitatives
et sont identifiées à l’ensemble de leur modalités. Les individus sont alors caractérisés par les modalités
qu’ils prennent
surXI
etX2 :
unindividu,
pourun tableau
donné, a
alors sareprésentation
confondue avec celle de la modalitéqu’il
choisit.Superposant S’,
etS2 ,
on obtient lesgraphiques
habituels de l’A.F.C.c.
L’analyse
descorrespondances multiples
et l’A.C.P. norméeL’analyse
descorrespondances multiples
est le casparticulier
de l’A.C.G.pour
lequel chaque
groupe de variablesXj
décrit les mj indicatrices d’une variablequalitative;
laprésentation
donnée de l’A.C.G.permet
de retrouver lesprincipales propriétés
de l’A.F.C.M.Revue de Statistiques Appliquees, 1986, vol XXXV, nc3 3
73 En
effet,
les tableaux G et A décrivant ici les modalités de deux variablesqualitatives, l’analyse canonique
de G et A est uneanalyse
des correspon- dancessimples
et enpossède
lespropriétés,
le tableau decontingence
associéétant ’AG = X.
Il est
plus
intéressant de remarquer quepuisque
G et A sont deuxvariables
qualitatives,
l’A.F.C.M. est une doubleanalyse discriminante,
cequi
prouve
l’équivalence
des deuxproblèmes
suivants :i)
rechercher uncodage
des modalités discriminant au mieux les indivi-dus,
ii)
rechercher uncodage
des individus discriminant au mieux les modalitésqui
conduisent tous deux à effectuer uneanalyse canonique
de Get A. Cette
équivalence
montrée par le calcul par GUTTMAN[7]
trouve ici uneinterprétation géométrique.
Remarques
1) L’équivalence
entre l’A.F.C.M. de X et l’A.F.C. du tableau(G, A)
aété montrée dans
CAZES, BAUMERDER,
BONNEFOUS et PAGES[3],
etse déduit ainsi du schéma donné
plus
haut(4) a)
schémaii) :
A.F.C.M.
(X) ~
A.F.D. de G et A - A.C.G.(G, A) H
A.F.C.(G, A) 2)
L’A.F.C.M. et l’A.C.P. normée étant deuxanalyses canoniques
par- ticulières dansR np
toute méthodegénéralisant l’analyse canonique
les admetcomme cas
particuliers.
Dans le cas de l’A.C.P.
normée,
on est amené àreprésenter
les np données contenues dans le tableau X et les nlignes
de ce tableau : on obtientainsi,
enplus
de lareprésentation
usuelle des n individus lareprésentation
des p axes de variables.5. LE PROGRAMME S.A.T.I.R.E.
Dans ce
paragraphe,
nous allons décrire brièvementl’algorithme
decalcul et les
principales
sorties du programme S.A.T.I.R.E.(Support
à l’Ana-lyse
des Tableaux d’IndividusRépétés
ouEvoluant).
On trouvera la liste des instructions de ce programme dans CASIN[2].
a.
L’algorithme
de calculPour obtenir les résultats de l’A.C.G. en effectuant un minimum de
calculs,
on recherche par leprocédé d’orthogonalisation
de SCHMIDT unebase
Dp-orthogonale
dechaque
espaceWj, Y, égale
àXj Aj,
la détermination descomposantes canoniques
étantindépendante
des bases retenues sur lesWj.
La
diagonalisation
deYDp tY
ou de‘YDp Y,
Y étant la matrice[Y1,...,Yp]
permet
alors d’obtenirrapidement
les composantes ou les facteurscanoniques.
Revue de Statistiques Appliquees, 1986, vol XXXV, n°3 3
74
b. Les sorties du programme
2022 Les
pouvoirs discriminants;
2022 Les axes
canoniques Z’ ;
2022 Les coordonnées des
descriptions
des individus selon les p tableaux :ZJ,
j
=1,..., p;
2022 Les corrélations entre les variables
canoniques Z’
et les variables dedépart;
2022 Les corrélations entre les variables
canoniques Z’
et les variablesZj,
i =
1,..., p;
$ Les facteurs
b’,
calculés àpartir
des variables dedépart
normées à1;
2022 Les variances résiduelles absolues
(ie
pour chacun des n individus l’inertiede sa classe pour l’axe
considéré);
2022 Les variances résiduelles relatives
(ie
pour chacun des n individus lerapport
de la variance résiduelle absolue à l’inertie du centre degravité).
6. CONCLUSION
La
présentation
que nous donnons ici del’analyse canonique généralisée
devrait renforcer la cohérence des
techniques d’analyse
dedonnées;
la sim-plicité
du critère utilisé - le critère de discrimination usuel -permet
une meilleurecompréhension
destechniques d’analyse linéaire,
et facilite l’inter-prétation
de leursrésultats,
enparticulier
dans le cas del’analyse canonique.
BIBLIOGRAPHIE
[1]
J.D. CARROLL. - "Ageneralization
of canonical correlationanalysis
to three or more sets of
variables",
Proc.76th
Amer.Psych. Assoc.,
1968.[2]
Ph. CASIN. -"L’analyse canonique généralisée
etl’analyse
des tableauxévolutifs...",
Thèse de 3ecycle,
Faculté des scienceséconomiques
et degestion, Strasbourg I,
1985.[3]
P.CAZES,
A.BAUMERDER,
S.BONNEFOUS,
J.P. PAGES. - "Co-dage
etanalyse
des tableauxlogiques.
Introduction à lapratique
desvariables
qualitatives",
Cahiers du B.U.R.O.n° 27,
1977.[4]
J.C.DEVILLE,
G. SAPORTA. -"Analyse harmonique qualitative",
Data
Analysis
andInformatics,
North-HollandPublishing Company,
1980.
[5]
B.ESCOFIER,
J. PAGES. -"L’analyse
factoriellemultiple.
Uneméthode de
comparaison
de groupes devariables",
Third InternationalSymposium
DataAnalysis
andInformatics,
1983.[6]
F. GLACON. 2014"Analyse conjointe
deplusieurs
matrices dedonnées",
Thèse de
3ecycle,
Université deGrenoble,
1981.Revue de Statistiques Appliquées, 1986, vol XXXV, n° 3
75
[7]
L. GUTTMAN. - "Thequantification
of a class ofattributes;
atheory
and method of scale
construction",
Social Science ResearchCouncil,
1941.
[8]
R.J. KETTENRING. - "CanonicalAnalysis
of several sets ofvariables",
Biometrika
n° 58,
1971.[9]
M. MASSON. -"Méthodologies générales
du traitementstatistique
del’information de
masse",
Nathan 1980.[10]
L.LEBART,
A.MORINEAU, J.P.
FENELON. - "Traitement des donnéesstatistiques",
Dunod 1979.[11]
J.J. Mc KEO N. - "Canonicalanalysis :
Some relations between cano-nical
correlation,
factoranalysis,
discriminant functionanalysis,
andscaling theory", Psychometric Monograph
n°13,
1966.[12]
J.M. ROMEDER. - "Méthodes et programmesd’analyse
discrimi-nante", Dunod, 1973.
[13]
G. SAPORTA. - "Liaisons entreplusieurs
ensembles de variables etcodage
des donnéesqualitatives",
Thèse de 3ecycle,
Université de ParisVI,
1975.[14]
M.TENENHAUS,
F.W. YOUNG. - "Ananalysis
andsynthesis
ofmultiple correspondance analysis, optimal scaling,
dualscaling, homoge- neity analysis
and other methods forquantifying categorical
multivariatedata", Psychometrika
vol.50,
n°1,
1985.Revue de Statistiques Appliquees, 1986, vol XXXV, no 3