• Aucun résultat trouvé

Rappels sur l’ACP avec m´ etriques

N/A
N/A
Protected

Academic year: 2022

Partager "Rappels sur l’ACP avec m´ etriques"

Copied!
3
0
0

Texte intégral

(1)

Universit´ e de Bordeaux - Master MIMSE - 2` eme ann´ ee

Rappels sur l’ACP avec m´ etriques

Marie Chavent

http://www.math.u-bordeaux.fr/ machaven/

2014-2015

1 Les donn´ ees

1. Z est une matrice n × p regroupant la mesure sur n individus de p variables quanti- tatives.

2. Chaque individu i est caract´ eris´ e par un vecteur z i ∈ R p (i` eme ligne de Z). L’espace des individus R p est muni d’une m´ etrique M qui est souvent l’indentit´ e I p .

3. Chaque variable j est caract´ eris´ ee par un vecteur z j ∈ R n (j` eme colonne de Z).

L’espace des variables R n est muni de la m´ etrique N = diag(. . . , p i , . . .) o` u p i , est le poids de l’individu i. G´ en´ eralement p i = n 1 .

4. Le tableau Z est g´ en´ eralement centr´ e pour fixer le centre de gravit´ e du nuage des individus ` a l’origine : pour chaque variable j on effectue z j → z j − z ¯ j 1 n , o` u ¯ z j = P n

i=1 p i z ij .

5. Le tableau Z est souvent r´ eduit ensuite pour ´ eliminer le fait que les variables sont sur mesur´ ees sur des ´ echelles (de variation) diff´ erentes : pour chaque variable j on effectue z jz s

j

j

, o` u s 2 j = P n

i=1 p i (z ij − z ¯ j ) 2 est la variance empirique de j.

2 D´ efinitions

1. Le vecteur Ψ α ∈ R n des coordonn´ ees factorielles (des scores) des n individus sur l’axe α est le vecteur des projections orthogonales (pour le produit scalaire M) des n individus sur l’axe engendr´ e par le vecteur v α (M-norm´ e ` a 1) maximisant l’inertie du nuage projet´ e. On a :

Ψ α = ZMv α

1

(2)

o` u v α est le vecteur propre de Z t NZM associ´ e ` a la valeur propre λ α .

Le vecteur Ψ α s’appelle aussi α` eme composantes principales. Les composantes prin- cipales sont donc des nouvelles variables synth´ etiques (des combinaisons lin´ eaires des variables initiales z j ) qui v´ erifient :

— la variance de la composante principale Ψ α est ´ egale ` a la valeur propre λ α : V ar(Ψ α ) = λ α .

— la corr´ elation lin´ eaire entre deux composantes principales Ψ α et Ψ α

0

est nulle : r(Ψ α , Ψ α

0

) = 0.

En r´ esum´ e, les k composantes principales Ψ 1 , . . . , Ψ k sont de nouvelles variables synth´ etiques (combinaisons lin´ eaires des variables initiales) non corr´ el´ ees entre elles, de variance maximale et les plus li´ ees (en un certain sens) aux variables initiales z 1 , ..., z p .

2. Le vecteur Φ α ∈ R p des coordonn´ ees factorielles (des loadings) des p variables sur l’axe α est le vecteur des projections orthogonales (pour le produit scalaire N) des p variables sur l’axe engendr´ e par le vecteur u α (N-norm´ e ` a 1) maximisant l’inertie du nuage projet´ e. On a :

Φ α = Z t Nu α

o` u u α est le vecteur propre de ZMZ t N associ´ e ` a la valeur propre λ α .

Le vecteur des loadings Φ α contient les corr´ elations des p variables avec la α` eme composantes principales Ψ α : φ = r(z j , Ψ α ).

3 ACP avec m´ etriques

L’ACP du triplet (Z, N, M) revient ` a effectuer une d´ ecomposition en valeurs singuli` eres g´ en´ eralis´ ee (GSVD - Generalized Singular Value Decomposition) d’une matrice r´ eelle Z de dimension n × p avec les m´ etriques N sur R n et M sur R p .

SVD g´ en´ eralis´ ee. La GSVD de la matrice Z de rang r avec les m´ etriques N et M donne la d´ ecomposition :

Z = UΛV t avec

— Λ = diag( √

λ 1 , . . . , √

λ r ) est la matrice diagonale des r valeurs singuli` eres de ZNZ t M et Z t NZM.

2

(3)

— U est la matrice de dimension n × r dont les colonnes sont les vecteurs propres de ZMZ t N et U t NU = I r (les vecteurs propres sont N-orthonorm´ es).

— V est la matrice de dimension p × r dont les colonnes sont les vecteurs propres de Z t NZM et V t MV = I r (les vecteurs propres sont M-orthonorm´ es).

En pratique, on peut obtenir la DVSG de Z en trouvant la DVS classique de ˜ Z = D 1/2 ZM 1/2 , c’est ` a dire la DVSG avec les m´ etriques I n sur R n et I p sur R p . On trouve ˜ Z = ˜ U Λ ˜ V ˜ t et :

Λ = ˜ Λ, U = D −1/2 U, ˜ V = M −1/2 V. ˜ Coordonn´ ees factorielles des individus et des variables

1. On note Ψ la matrice de dimension n × r des coordonn´ ees des M-projections des n individus (les lignes de Z) sur les axes de vecteurs directeurs v 1 , . . . , v r (colonnes de V). Cette matrice est aussi appell´ ee matrice des coordonn´ ees factorielles (scores) des individus. On a par d´ efinition que :

Ψ = ZMV On en d´ eduit donc que :

Ψ = UΛ On en d´ eduit ´ egalement que u α = Ψ α / √

λ α est la α` eme composante principale stan- dardis´ ee (divis´ ee par son ´ ecart-type) et que U est la matrice des composantes princi- pales standardis´ ees.

2. On note Φ la matrice de dimension p × r des coordonn´ ees des N-projections des p variables (les colonnes de Z) sur les axes de vecteurs directeurs u 1 , . . . , u r (colonnes de U). Cette matrice est aussi appell´ ee matrice des coordonn´ ees factorielles (loadings) des variables. On a par d´ efinition que :

Φ = Z t MU On en d´ eduit donc que :

Φ = VΛ

3

Références

Documents relatifs

Certains r´esultats retourn´es par Maple (e.g. ´el´ements propres d’une matrice) se trouvent dans une structure ordonn´ee (e.g. liste, ensemble, vecteur).. Il est parfois

On appelle prix d’´ equilibre d’un produit, le prix pour lequel l’offre et la demande sont ´ egales.. Quel est alors le nombre de produits demand´ es (et donc

On appelle prix d’´ equilibre d’un produit, le prix pour lequel l’offre et la demande sont ´ egales.. Quel est alors le nombre de produits demand´ es (et donc

[r]

cette matrice étant triangulaire inférieure, ses valeurs propres sont les coecients de sa diagonale : 4, 1 et

La présentation, la lisibilité et la qualité de la rédaction entreront pour une part importante dans l'appréciation des copies.. L'utilisation de toute calculatrice, de tout

Pour trouver les coordonn´ ees d’un vecteur dans une base, on ´ ecrit l’´ equation (vectorielle) caract´ eristique on convertit cette ´ equation en syst` eme num´ erique on

Ce vecteur est constitu´e de trois vecteurs qui g´en`erent trois surfaces par produit vectoriel de deux d’entre eux et un volume par r´ealisation du produit mixte entre les trois...