Une solution analytique pour la rotation planaire en Analyse Factorielle des Correspondances Multiples

(1)

HAL Id: inria-00386742

https://hal.inria.fr/inria-00386742

Submitted on 22 May 2009

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires

Une solution analytique pour la rotation planaire en Analyse Factorielle des Correspondances Multiples

Marie Chavent, Vanessa Kuentz, Jérôme Saracco

To cite this version:

Marie Chavent, Vanessa Kuentz, Jérôme Saracco. Une solution analytique pour la rotation planaire en

Analyse Factorielle des Correspondances Multiples. 41èmes Journées de Statistique, SFdS, Bordeaux,

2009, Bordeaux, France, France. �inria-00386742�

(2)

Une solution analytique pour la rotation planaire en Analyse Factorielle des

Correspondances Multiples

Marie Chavent

^1,2

& Vanessa Kuentz

^1,2

& J´ erˆ ome Saracco

^1,2,3

1

Universit´ e de Bordeaux, IMB, CNRS, UMR 5251, 351 Cours de la lib´ eration

33405 Talence

(e-mail : Marie.Chavent,Vanessa.Kuentz@math.u-bordeaux1.fr)

2

INRIA Bordeaux Sud-Ouest, CQFD team

3

Universit´ e Montesquieu - Bordeaux IV, GREThA, CNRS, UMR 5113, Avenue L´ eon Duguit

33608 Pessac Cedex

(e-mail : Jerome.Saracco@u-bordeaux4.fr)

R´ esum´ e

L’Analyse en Composantes Principales (ACP) et l’Analyse Factorielle des Corres- pondances Multiples (AFCM) sont respectivement deux m´ ethodes de description statistique multidimensionnelle de donn´ ees quantitatives et qualitatives. Une rota- tion peut ensuite ˆ etre appliqu´ ee ` a la matrice des scores des composantes principales.

La d´ efinition d’un crit` ere de rotation permet alors d’obtenir une structure simple, facilitant ainsi l’interpr´ etation des r´ esultats. Une solution analytique en deux dimen- sions a ´ et´ e propos´ ee pour le crit` ere varimax en ACP. Nous proposons ici une solution analytique en deux dimensions pour la rotation en AFCM utilisant un crit` ere inspir´ e de varimax et bas´ e sur la notion de rapport de corr´ elation.

Mots-cl´ es : Analyse Factorielle des Correspondances Multiples, rotation, rap- port de corr´ elation.

Abstract

Principal Component Analysis (PCA) and Multiple Correspondence Analysis (MCA) are well-known multivariate methods for statistical description of respectively quan- titative and qualitative data. A rotation may then be applied to the principal component scores matrix. The definition of a criterion enables to achieve simple structure, thereby simplifying the interpretation of the results. A two-dimensional analytic solution has been proposed for varimax rotation in PCA. We propose here a two-dimensional analytic solution for rotation in MCA using a varimax-based cri- terion relying on correlation ratio.

Keywords: Multiple Correspondence Analysis, rotation, correlation ratio.

(3)

1 Introduction

L’Analyse en Composantes Principales (ACP) (voir par exemple Jolliffe, 2002) pour des donn´ ees quantitatives et l’Analyse Factorielle des Correspondances Multiples pour des donn´ ees qualitatives (AFCM) (voir par exemple Greenacre et Blasius, 2006) sont deux m´ ethodes usuelles de r´ eduction de dimension. Elles utilisent une d´ ecomposition en valeurs singuli` eres pour ´ ecrire la matrice des donn´ ees comme le produit de deux matrices.

Cependant cette approximation n’est pas unique, ainsi les composantes principales sont d´ etermin´ ees ` a une rotation pr` es. Nous traiterons ici le cas de rotations orthogonales.

Concernant les variables quantitatives, l’ACP approxime la matrice standardis´ ee des donn´ ees par le produit de la matrice des composantes principales et la matrice des sa- turations (“loadings”). Cette derni` ere joue un rˆ ole fondamental dans l’interpr´ etation des r´ esultats car elle contient les corr´ elations entre les variables et les composantes. Appliquer la matrice de rotation T ` a la matrice des saturations A et ` a la matrice des compo- santes principales garantit que la matrice des saturations apr` es rotation B = AT contient toujours les corr´ elations entre les variables et les composantes apr` es rotation. L’id´ ee est d’appliquer une rotation ` a la matrice des saturations et ` a celle des composantes afin que les corr´ elations contenues dans la matrice B soient fortes ou faibles. Diff´ erents crit` eres ont

´ et´ e propos´ es dont le plus connu est varimax introduit par Kaiser (1958). D´ efinir la matrice de rotation optimale se r´ esume donc ` a un probl` eme d’optimisation sous contraintes du crit` ere varimax f(AT).

Pour les variables qualitatives, l’AFCM est pr´ esent´ ee ici comme une ACP appliqu´ ee ` a la matrice des profils lignes. La matrice des fr´ equences (divis´ ee par les poids des lignes et des colonnes) est approxim´ ee par le produit de deux matrices : la matrice des composantes principales des lignes (objets) et celle des composantes principales des colonnes (moda- lit´ es). Notons A cette derni` ere matrice et B = AT sa version apr` es rotation. Cependant B ne relie pas directement les variables aux composantes principales apr` es rotation et par cons´ equent ne joue pas le rˆ ole pr´ ec´ edent de la matrice des saturations. Pour cette raison, le crit` ere varimax f n’est pas appliqu´ e directement ` a la matrice B (comme en ACP) mais ` a la matrice C = g(B) dont les valeurs sont les rapports de corr´ elation entre les variables et les composantes principales des objets apr` es rotation. Notons que ce crit` ere est celui uti- lis´ e par Kiers (1991) dans sa m´ ethode PCAMIX pour la recherche d’une structure simple pour des donn´ ees quantitatives et/ou qualitatives. L’objectif est d’obtenir dans chaque colonne de C des valeurs ´ elev´ ees ou faibles. D´ efinir la meilleure matrice de rotation se r´ esume donc ` a un probl` eme d’optimisation du crit` ere f ◦ g(AT).

Dans le cas quantitatif et qualitatif, lorsqu’on retient deux composantes principales,

la rotation a lieu dans un plan. La matrice de rotation s’´ ecrit en fonction d’un angle de

rotation et on obtient un probl` eme d’optimisation r´ eel non contraint. En ACP, l’expression

analytique de l’angle θ optimisant le crit` ere varimax f est donn´ ee par Kaiser (1958). Nous

proposons ici une solution analytique en deux dimensions pour le crit` ere h = f ◦ g pour

la rotation en AFCM.

(4)

Dans la Section 2, nous pr´ esentons la rotation en AFCM puis nous donnons dans la Section 3 l’´ ecriture de la solution analytique en dimension deux.

2 Rotation en AFCM

Notations. Soit X une matrice de donn´ ees qualitatives, o` u x

ij

∈ M

_j

avec M

_j

l’en- semble des modalit´ es de x

_j

. Soit O = (o

_is

)

n×q

la matrice X = (x

_ij

)

n×p

convertie en une matrice indicatrice ` a n lignes et q colonnes, o` u q =

p

X

j=1

q

_j

avec q

_j

le nombre de modalit´ es de x

j

. A chaque ligne i de O, un ´ el´ ement vaut 1 si l’objet poss` ede la modalit´ e s de la variable qualitative correspondante ; sinon l’´ el´ ement vaut 0. Ainsi la somme des ´ el´ ements d’une ligne vaut p. Comme la matrice O peut ˆ etre consid´ er´ ee comme une sorte de table de contingence, la matrice des fr´ equences F = (f

is

)

n×q

peut ˆ etre construite o` u f

is

=

^o_np^is

car P

i,s

o

_is

= np. Soit G

_s

= {e

_i

∈ E|o

_is

= 1} et n

_s

= card(G

_s

). Les sommes marginales de la matrice des correspondances F sont utilis´ ees pour d´ efinir les poids des lignes et des co- lonnes : D

_n

= diag{f

_i.

, pour i = 1, ..., n} avec f

_i.

=

_n¹

, et D

_q

= diag{f

_.s

, pour s = 1, ..., q}

avec f

_.s

=

ⁿ_np^s

. Notons m le rang de F et F e = D

^1/2n

FD

^−1/2q

la matrice F dont les ´ el´ ements ont ´ et´ e divis´ es par √

f

_i.

f

_.s

.

AFCM. L’AFCM est pr´ esent´ ee ici comme une ACP sur la matrice des profils lignes R = D

⁻¹_n

F obtenue en divisant chaque ligne i de la matrice des fr´ equences F par la marge f

i.

. D’un point de vue g´ eom´ etrique, l’AFCM de la matrice non centr´ ee des profils lignes ´ etudie les n lignes de R avec les m´ etriques D

_n

sur R

ⁿ

et D

⁻¹_q

sur R

^q

. Dans une premi` ere ´ etape, l’AFCM cherche un axe de vecteur directeur w (de D

⁻¹_q

-norme ´ egale ` a 1) tel que le vecteur y ∈ R

ⁿ

des D

⁻¹_q

-projections des n lignes de R sur cet axe, soit de D

_n

-norme maximale. La premi` ere composante principale est y

₂

= RD

^−1/2q

v

₂

o` u v

₂

est le vecteur propre associ´ e ` a la premi` ere valeur propre non triviale λ

₂

de F e

^t

F. Les autres e composantes principales sont d´ efinies de fa¸con similaire par y

_α

= RD

^−1/2q

v

_α

, α = 3 . . . m, o` u v

_α

est le vecteur propre associ´ e ` a la α` eme plus grande valeur propre de F e

^t

F. e

Formule de reconstruction en AFCM. Notons Y la matrice de dimension (n, m) dont les colonnes sont les m composantes principales (incluant celle associ´ ee ` a la premi` ere valeur propre triviale) et Λ = diag( √

λ

₁

, . . . , √

λ

_m

) la matrice diagonale de leurs ´ ecarts- types. Cette matrice de correspondance divis´ ee par les poids des lignes et des colonnes D

⁻¹_n

FD

⁻¹_q

peut s’´ ecrire comme le produit de deux matrices :

D

⁻¹_n

FD

⁻¹_q

= Y

^∗

A

^t

, (1)

o` u Y

^∗

= YΛ

⁻¹

est la matrice dont les colonnes sont les composantes principales standar-

dis´ ees et A est la matrice dont le terme g´ en´ eral a

_sα

vaut ¯ y

^∗_α,s

la moyenne de la composante

(5)

principale standardis´ ee y

^∗_α

calcul´ ee sur les objets poss´ edant la modalit´ e s. Des d´ etails concernant cette formule sont disponibles dans Chavent, Kuentz, Saracco (2009).

Structure simple. Soit T une matrice de rotation orthonormale de dimension (r, r) o` u r ≤ m est le nombre de composantes principales retenues. Les matrices Y

^∗

et A sont d´ esormais de dimension respective (n, r) et (q, r). Comme Y

^∗

A

^t

= Y

^∗

TT

^t

A

^t

, l’approxi- mation de la matrice D

⁻¹_n

FD

⁻¹_q

par le produit de deux matrices n’est pas unique. Notons Z = Y

^∗

T la matrice des composantes principales standardis´ ees apr` es rotation et B = AT la matrice A apr` es rotation dont le terme g´ en´ eral b

_sα

vaut maintenant ¯ z

_α,s

la moyenne de la composante principale standardis´ ee apr` es rotation z

α

calcul´ ee sur les objets apparte- nant ` a la modalit´ e s. La matrice B ne donne pas directement une id´ ee de la liaison entre les variables et les composantes principales apr` es rotation. On transforme donc la matrice B = AT en C = g(AT) de dimension (p, r) dont le terme g´ en´ eral :

c

_jα

= p||b

^(j)_α

||

²

D^(j)q

, (2)

o` u l’exposant (j ) signifie qu’on consid` ere seulement les ´ el´ ements de D

_q

et b

_α

correspondant aux modalit´ es de la variable x

_j

. Ainsi D

^(j)q

(resp. b

^(j)α

) est une sous-matrice (resp. sous- vecteur) de D

q

(resp. b

α

) de dimension (q

j

, q

j

) (resp. longueur q

j

). On montre alors que c

_jα

= η

²

(x

_j

, z

_α

) =

^s

2 j

s²(zα)

, o` u s

²_j

=

_n¹

X

s∈Mj

n

_s

(¯ z

_α,s

−¯ z

_α

)

²

est la variance inter-classe empirique de z

α

dans la partition de E d´ efinie par les modalit´ es de x

j

. Ainsi C est la matrice des rapports de corr´ elation empiriques entre les variables x

_j

et les composantes principales standardis´ ees apr` es rotation z

_α

. Elle va jouer le rˆ ole de la matrice des saturations dans le cadre de la rotation varimax en ACP. L’id´ ee est donc de choisir la matrice T pour que ces rapports de corr´ elation soient les plus proches possibles de 0 ou de 1.

Le crit` ere de rotation. Le crit` ere varimax f n’est pas appliqu´ e directement ` a B = AT, comme en ACP, mais ` a la matrice des rapports de corr´ elation C = g(AT). Le crit` ere h ainsi obtenu est d´ efini par :

h(AT) = f ◦ g(AT) = f (C) =

q

X

α=1





 P

p

j=1

c

²_jα

p −

P

p j=1

c

²_jα

p

!

2







=

q

X

α=1





 P

p

j=1

(p P

s∈Mj

f

_.s

b

²_sα

)

²

p −

P

p

j=1

(p P

s∈Mj

f

_.s

b

²_sα

) p

!

2







=

q

X

α=1





 p

p

X

j=1



 X

s∈Mj

f

_.s

b

²_sα





2

−





p

X

j=1

X

s∈Mj

f

_.s

b

²_sα





2







(3)

(6)

Pour une matrice A donn´ ee, le probl` eme d’optimisation s’´ ecrit donc : ( max

T

h(AT),

s.c. TT

^t

= I

^r

. (4)

3 Une solution analytique pour la rotation en dimen- sion deux

En dimension r = 2, la matrice de rotation orthogonale T s’´ ecrit en fonction d’un angle de rotation θ :

T =

cos θ −sin θ sin θ cos θ

. (5)

Le probl` eme d’optimisation (4) s’´ ecrit alors comme un probl` eme non contraint : n max

θ∈R

h(θ). (6)

L’expression de h(θ) et les d´ etails du calcul dre la solution analytique sont disponibles dans Chavent, Kuentz, Saracco (2009). On ´ ecrit la d´ eriv´ ee de h par rapport ` a θ :

∂h

∂θ = 2(a + bcos(4θ) + csin(4θ)), (7)

o` u :

a = (p − 1)

p

X

j=1

X

s∈M_j

X

t∈M_j

f

_.s

f

_.t

α

_st

β

_st

−

p

X

j=1 p

X

l6=j

X

s∈M_j

X

t∈M_l

f

_.s

f

_.t

α

_st

β

_st

,

b = (p − 1)

p

X

j=1

X

s∈Mj

X

t∈Mj

f

_.s

f

_.t

δ

_st

γ

_st

−

p

X

j=1 p

X

l6=j

X

s∈Mj

X

t∈M_l

f

_.s

f

_.t

δ

_st

γ

_st

,

c = (p − 1)

p

X

j=1

X

s∈M_j

X

t∈M_j

f

.s

f

.t

1 2 (γ

_st²

− δ

_st²

) −

p

X

j=1 p

X

l6=j

X

s∈M_j

X

t∈M_l

f

.s

f

.t

1 2 (γ

_st²

− δ

_st²

), (8) et α

_st

= a

_s1

a

_t1

+ a

_s2

a

_t2

, β

_st

= a

_s2

a

_t1

− a

_s1

a

_t2

, γ

_st

= a

_s2

a

_t1

+ a

_s1

a

_t2

et δ

_st

= a

_s1

a

_t1

− a

_s2

a

_t2

.

Pour r´ esoudre a + bcos(4θ) + csin(4θ) = 0, on divise chaque terme par (b

²

+ c

²

)

^1/2

et on introduit l’angle ϕ ∈] − π, +π]tel que cos(ϕ) =

_(b₂_+c^b₂₎1/2

et sin(ϕ) =

_(b₂_+c^c₂₎1/2

. On obtient :

a

(b

²

+ c

²

)

^1/2

+ cos(ϕ)cos(4θ) + sin(ϕ)sin(4θ) = a

(b

²

+ c

²

)

^1/2

+ cos(4θ − ϕ) = 0

(7)

Cette ´ equation poss` ede alors deux solutions : θ ˆ = 1

4 (± arcos(− a

√ b

²

+ c

²

) + ϕ), (9) correspondant respectivement au minimum et maximum de h (sous la condition que |a| ≤ (b

²

+ c

²

)

^1/2

, ce qui est n´ ecessairement v´ erifi´ ee car h est p´ eriodique et d´ erivable).

4 Conclusion

Nous avons propos´ e une solution analytique en deux dimensions pour la rotation en AFCM. Nous illustrerons sur des donn´ ees simul´ ees la validit´ e de l’approche. Nous mon- trerons l’int´ erˆ et de la rotation pour l’interpr´ etation des r´ esultats d’une AFCM sur des donn´ ees r´ eelles issues d’une enquˆ ete de satisfaction des plaisanciers sur le Canal des Deux Mers (commandit´ ee par Voies Navigables de France en 2008). Des d´ etails sur ces ap- plications sont disponibles dans Chavent, Kuentz, Saracco (2009). En outre ce r´ esultat pourra ˆ etre utilis´ e pour ´ etendre une approche de type VARCLUS pour la classification de variables qualitatives.

Bibliographie

[1] Chavent, M., Kuentz, V., Saracco, J. (2009), A two-dimensional analytic solution for rotation in Multiple Correspondence Analysis, Submitted paper.