HAL Id: inria-00386742
https://hal.inria.fr/inria-00386742
Submitted on 22 May 2009
HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires
Une solution analytique pour la rotation planaire en Analyse Factorielle des Correspondances Multiples
Marie Chavent, Vanessa Kuentz, Jérôme Saracco
To cite this version:
Marie Chavent, Vanessa Kuentz, Jérôme Saracco. Une solution analytique pour la rotation planaire en
Analyse Factorielle des Correspondances Multiples. 41èmes Journées de Statistique, SFdS, Bordeaux,
2009, Bordeaux, France, France. �inria-00386742�
Une solution analytique pour la rotation planaire en Analyse Factorielle des
Correspondances Multiples
Marie Chavent
1,2& Vanessa Kuentz
1,2& J´ erˆ ome Saracco
1,2,31
Universit´ e de Bordeaux, IMB, CNRS, UMR 5251, 351 Cours de la lib´ eration
33405 Talence
(e-mail : Marie.Chavent,Vanessa.Kuentz@math.u-bordeaux1.fr)
2
INRIA Bordeaux Sud-Ouest, CQFD team
3
Universit´ e Montesquieu - Bordeaux IV, GREThA, CNRS, UMR 5113, Avenue L´ eon Duguit
33608 Pessac Cedex
(e-mail : Jerome.Saracco@u-bordeaux4.fr)
R´ esum´ e
L’Analyse en Composantes Principales (ACP) et l’Analyse Factorielle des Corres- pondances Multiples (AFCM) sont respectivement deux m´ ethodes de description statistique multidimensionnelle de donn´ ees quantitatives et qualitatives. Une rota- tion peut ensuite ˆ etre appliqu´ ee ` a la matrice des scores des composantes principales.
La d´ efinition d’un crit` ere de rotation permet alors d’obtenir une structure simple, facilitant ainsi l’interpr´ etation des r´ esultats. Une solution analytique en deux dimen- sions a ´ et´ e propos´ ee pour le crit` ere varimax en ACP. Nous proposons ici une solution analytique en deux dimensions pour la rotation en AFCM utilisant un crit` ere inspir´ e de varimax et bas´ e sur la notion de rapport de corr´ elation.
Mots-cl´ es : Analyse Factorielle des Correspondances Multiples, rotation, rap- port de corr´ elation.
Abstract
Principal Component Analysis (PCA) and Multiple Correspondence Analysis (MCA) are well-known multivariate methods for statistical description of respectively quan- titative and qualitative data. A rotation may then be applied to the principal component scores matrix. The definition of a criterion enables to achieve simple structure, thereby simplifying the interpretation of the results. A two-dimensional analytic solution has been proposed for varimax rotation in PCA. We propose here a two-dimensional analytic solution for rotation in MCA using a varimax-based cri- terion relying on correlation ratio.
Keywords: Multiple Correspondence Analysis, rotation, correlation ratio.
1 Introduction
L’Analyse en Composantes Principales (ACP) (voir par exemple Jolliffe, 2002) pour des donn´ ees quantitatives et l’Analyse Factorielle des Correspondances Multiples pour des donn´ ees qualitatives (AFCM) (voir par exemple Greenacre et Blasius, 2006) sont deux m´ ethodes usuelles de r´ eduction de dimension. Elles utilisent une d´ ecomposition en valeurs singuli` eres pour ´ ecrire la matrice des donn´ ees comme le produit de deux matrices.
Cependant cette approximation n’est pas unique, ainsi les composantes principales sont d´ etermin´ ees ` a une rotation pr` es. Nous traiterons ici le cas de rotations orthogonales.
Concernant les variables quantitatives, l’ACP approxime la matrice standardis´ ee des donn´ ees par le produit de la matrice des composantes principales et la matrice des sa- turations (“loadings”). Cette derni` ere joue un rˆ ole fondamental dans l’interpr´ etation des r´ esultats car elle contient les corr´ elations entre les variables et les composantes. Appliquer la matrice de rotation T ` a la matrice des saturations A et ` a la matrice des compo- santes principales garantit que la matrice des saturations apr` es rotation B = AT contient toujours les corr´ elations entre les variables et les composantes apr` es rotation. L’id´ ee est d’appliquer une rotation ` a la matrice des saturations et ` a celle des composantes afin que les corr´ elations contenues dans la matrice B soient fortes ou faibles. Diff´ erents crit` eres ont
´ et´ e propos´ es dont le plus connu est varimax introduit par Kaiser (1958). D´ efinir la matrice de rotation optimale se r´ esume donc ` a un probl` eme d’optimisation sous contraintes du crit` ere varimax f(AT).
Pour les variables qualitatives, l’AFCM est pr´ esent´ ee ici comme une ACP appliqu´ ee ` a la matrice des profils lignes. La matrice des fr´ equences (divis´ ee par les poids des lignes et des colonnes) est approxim´ ee par le produit de deux matrices : la matrice des composantes principales des lignes (objets) et celle des composantes principales des colonnes (moda- lit´ es). Notons A cette derni` ere matrice et B = AT sa version apr` es rotation. Cependant B ne relie pas directement les variables aux composantes principales apr` es rotation et par cons´ equent ne joue pas le rˆ ole pr´ ec´ edent de la matrice des saturations. Pour cette raison, le crit` ere varimax f n’est pas appliqu´ e directement ` a la matrice B (comme en ACP) mais ` a la matrice C = g(B) dont les valeurs sont les rapports de corr´ elation entre les variables et les composantes principales des objets apr` es rotation. Notons que ce crit` ere est celui uti- lis´ e par Kiers (1991) dans sa m´ ethode PCAMIX pour la recherche d’une structure simple pour des donn´ ees quantitatives et/ou qualitatives. L’objectif est d’obtenir dans chaque colonne de C des valeurs ´ elev´ ees ou faibles. D´ efinir la meilleure matrice de rotation se r´ esume donc ` a un probl` eme d’optimisation du crit` ere f ◦ g(AT).
Dans le cas quantitatif et qualitatif, lorsqu’on retient deux composantes principales,
la rotation a lieu dans un plan. La matrice de rotation s’´ ecrit en fonction d’un angle de
rotation et on obtient un probl` eme d’optimisation r´ eel non contraint. En ACP, l’expression
analytique de l’angle θ optimisant le crit` ere varimax f est donn´ ee par Kaiser (1958). Nous
proposons ici une solution analytique en deux dimensions pour le crit` ere h = f ◦ g pour
la rotation en AFCM.
Dans la Section 2, nous pr´ esentons la rotation en AFCM puis nous donnons dans la Section 3 l’´ ecriture de la solution analytique en dimension deux.
2 Rotation en AFCM
Notations. Soit X une matrice de donn´ ees qualitatives, o` u x
ij∈ M
javec M
jl’en- semble des modalit´ es de x
j. Soit O = (o
is)
n×qla matrice X = (x
ij)
n×pconvertie en une matrice indicatrice ` a n lignes et q colonnes, o` u q =
p
X
j=1
q
javec q
jle nombre de modalit´ es de x
j. A chaque ligne i de O, un ´ el´ ement vaut 1 si l’objet poss` ede la modalit´ e s de la variable qualitative correspondante ; sinon l’´ el´ ement vaut 0. Ainsi la somme des ´ el´ ements d’une ligne vaut p. Comme la matrice O peut ˆ etre consid´ er´ ee comme une sorte de table de contingence, la matrice des fr´ equences F = (f
is)
n×qpeut ˆ etre construite o` u f
is=
onpiscar P
i,s
o
is= np. Soit G
s= {e
i∈ E|o
is= 1} et n
s= card(G
s). Les sommes marginales de la matrice des correspondances F sont utilis´ ees pour d´ efinir les poids des lignes et des co- lonnes : D
n= diag{f
i., pour i = 1, ..., n} avec f
i.=
n1, et D
q= diag{f
.s, pour s = 1, ..., q}
avec f
.s=
nnps. Notons m le rang de F et F e = D
1/2nFD
−1/2qla matrice F dont les ´ el´ ements ont ´ et´ e divis´ es par √
f
i.f
.s.
AFCM. L’AFCM est pr´ esent´ ee ici comme une ACP sur la matrice des profils lignes R = D
−1nF obtenue en divisant chaque ligne i de la matrice des fr´ equences F par la marge f
i.. D’un point de vue g´ eom´ etrique, l’AFCM de la matrice non centr´ ee des profils lignes ´ etudie les n lignes de R avec les m´ etriques D
nsur R
net D
−1qsur R
q. Dans une premi` ere ´ etape, l’AFCM cherche un axe de vecteur directeur w (de D
−1q-norme ´ egale ` a 1) tel que le vecteur y ∈ R
ndes D
−1q-projections des n lignes de R sur cet axe, soit de D
n-norme maximale. La premi` ere composante principale est y
2= RD
−1/2qv
2o` u v
2est le vecteur propre associ´ e ` a la premi` ere valeur propre non triviale λ
2de F e
tF. Les autres e composantes principales sont d´ efinies de fa¸con similaire par y
α= RD
−1/2qv
α, α = 3 . . . m, o` u v
αest le vecteur propre associ´ e ` a la α` eme plus grande valeur propre de F e
tF. e
Formule de reconstruction en AFCM. Notons Y la matrice de dimension (n, m) dont les colonnes sont les m composantes principales (incluant celle associ´ ee ` a la premi` ere valeur propre triviale) et Λ = diag( √
λ
1, . . . , √
λ
m) la matrice diagonale de leurs ´ ecarts- types. Cette matrice de correspondance divis´ ee par les poids des lignes et des colonnes D
−1nFD
−1qpeut s’´ ecrire comme le produit de deux matrices :
D
−1nFD
−1q= Y
∗A
t, (1)
o` u Y
∗= YΛ
−1est la matrice dont les colonnes sont les composantes principales standar-
dis´ ees et A est la matrice dont le terme g´ en´ eral a
sαvaut ¯ y
∗α,sla moyenne de la composante
principale standardis´ ee y
∗αcalcul´ ee sur les objets poss´ edant la modalit´ e s. Des d´ etails concernant cette formule sont disponibles dans Chavent, Kuentz, Saracco (2009).
Structure simple. Soit T une matrice de rotation orthonormale de dimension (r, r) o` u r ≤ m est le nombre de composantes principales retenues. Les matrices Y
∗et A sont d´ esormais de dimension respective (n, r) et (q, r). Comme Y
∗A
t= Y
∗TT
tA
t, l’approxi- mation de la matrice D
−1nFD
−1qpar le produit de deux matrices n’est pas unique. Notons Z = Y
∗T la matrice des composantes principales standardis´ ees apr` es rotation et B = AT la matrice A apr` es rotation dont le terme g´ en´ eral b
sαvaut maintenant ¯ z
α,sla moyenne de la composante principale standardis´ ee apr` es rotation z
αcalcul´ ee sur les objets apparte- nant ` a la modalit´ e s. La matrice B ne donne pas directement une id´ ee de la liaison entre les variables et les composantes principales apr` es rotation. On transforme donc la matrice B = AT en C = g(AT) de dimension (p, r) dont le terme g´ en´ eral :
c
jα= p||b
(j)α||
2D(j)q
, (2)
o` u l’exposant (j ) signifie qu’on consid` ere seulement les ´ el´ ements de D
qet b
αcorrespondant aux modalit´ es de la variable x
j. Ainsi D
(j)q(resp. b
(j)α) est une sous-matrice (resp. sous- vecteur) de D
q(resp. b
α) de dimension (q
j, q
j) (resp. longueur q
j). On montre alors que c
jα= η
2(x
j, z
α) =
s2 j
s2(zα)
, o` u s
2j=
n1X
s∈Mj
n
s(¯ z
α,s−¯ z
α)
2est la variance inter-classe empirique de z
αdans la partition de E d´ efinie par les modalit´ es de x
j. Ainsi C est la matrice des rapports de corr´ elation empiriques entre les variables x
jet les composantes principales standardis´ ees apr` es rotation z
α. Elle va jouer le rˆ ole de la matrice des saturations dans le cadre de la rotation varimax en ACP. L’id´ ee est donc de choisir la matrice T pour que ces rapports de corr´ elation soient les plus proches possibles de 0 ou de 1.
Le crit` ere de rotation. Le crit` ere varimax f n’est pas appliqu´ e directement ` a B = AT, comme en ACP, mais ` a la matrice des rapports de corr´ elation C = g(AT). Le crit` ere h ainsi obtenu est d´ efini par :
h(AT) = f ◦ g(AT) = f (C) =
q
X
α=1
P
pj=1
c
2jαp −
P
p j=1c
2jαp
!
2
=
q
X
α=1
P
pj=1
(p P
s∈Mj
f
.sb
2sα)
2p −
P
pj=1
(p P
s∈Mj
f
.sb
2sα) p
!
2
=
q
X
α=1
p
p
X
j=1
X
s∈Mj
f
.sb
2sα
2
−
p
X
j=1
X
s∈Mj
f
.sb
2sα
2
(3)
Pour une matrice A donn´ ee, le probl` eme d’optimisation s’´ ecrit donc : ( max
T
h(AT),
s.c. TT
t= I
r. (4)
3 Une solution analytique pour la rotation en dimen- sion deux
En dimension r = 2, la matrice de rotation orthogonale T s’´ ecrit en fonction d’un angle de rotation θ :
T =
cos θ −sin θ sin θ cos θ
. (5)
Le probl` eme d’optimisation (4) s’´ ecrit alors comme un probl` eme non contraint : n max
θ∈R
h(θ). (6)
L’expression de h(θ) et les d´ etails du calcul dre la solution analytique sont disponibles dans Chavent, Kuentz, Saracco (2009). On ´ ecrit la d´ eriv´ ee de h par rapport ` a θ :
∂h
∂θ = 2(a + bcos(4θ) + csin(4θ)), (7)
o` u :
a = (p − 1)
p
X
j=1
X
s∈Mj
X
t∈Mj
f
.sf
.tα
stβ
st−
p
X
j=1 p
X
l6=j
X
s∈Mj
X
t∈Ml
f
.sf
.tα
stβ
st,
b = (p − 1)
p
X
j=1
X
s∈Mj
X
t∈Mj
f
.sf
.tδ
stγ
st−
p
X
j=1 p
X
l6=j
X
s∈Mj
X
t∈Ml
f
.sf
.tδ
stγ
st,
c = (p − 1)
p
X
j=1
X
s∈Mj
X
t∈Mj
f
.sf
.t1
2 (γ
st2− δ
st2) −
p
X
j=1 p
X
l6=j
X
s∈Mj
X
t∈Ml