Compression de variables : Analyse en Composantes Principales (ACP)

₍_i₌₁_{, ..., n}₎

Compression de variables : Analyse en Composantes Principales (ACP)

L'analyse en composantes principales est une méthode de statistique exploratoire

per-mettant de décrire un grand tableau de données de type individus / variables. L'intérêt

majeur d'une ACP est d'orir une meilleure visualisation possible des données

multi-variées, en identiant les hyperplans dans lesquels la dispersion est maximale, mettant

en évidence avec le maximum de précision les relations de proximité et d'éloignement

entre les variables [55].Une ACP permet donc de fournir une représentation graphique

optimale des observations projetées dans un sous-espace de dimension réduite (d < p),

minimisant la déformation du nuage de points initial.

Mathématiquement, l'ACP correspond à l'approximation de la matrice de donnéesXpar

une matriceT de même dimension(n, p)mais de rangd < p. Ceci est réalisé à travers une

projection orthogonale linéaire qui projette les observations multidimensionnelles

repré-sentées dans un sous-espace de dimensionp dans un sous-espace de dimension inférieure

d en maximisant la variance des projections. La solution de ce problème de

maximisa-tion est basée sur le calcul des valeurs et vecteurs propres de la matrice de covariance

des données, puisqu'on analyse essentiellement la dispersion des données considérées.

Cette solution dénit à la fois la projection du sous-espace de dimensionpdans le

sous-espace de dimension d et la projection inverse permettant de reconstruire les données

observées. L'ACP peut être donc considérée comme une technique de minimisation de

l'erreur quadratique de reconstruction ou une technique de maximisation de la variance

des projections (il faut noter que ces deux critères sont équivalents).

3.2.1 Minimisation d'erreur/maximisation variance

L'objectif d'une ACP étant de trouver un sous-espace de dimension d < p qui permet

d'avoir une représentation réduite de X, cette méthode consiste à trouver une nouvelle

base dans laquelle la projection du nuage de points initial est la plus dèle possible. Cette

nouvelle base est obtenue par combinaison linéaire de la base originelle. C'est donc tout

simplement un problème de changement de base. Soit P une matrice de changement

de base de dimension p×p telle que P = [p

. . . p

. . . p

, où p

= (p

, . . . , p

.

Un nombre d des colonnes de P vont former les vecteurs de base orthonormés d'un

sous-espace R

de représentation réduite des données. Ces vecteurs sont orthogonaux

2 à 2 (i.e. p

p

= 0 si j 6= k) et de norme égale à 1 (i.e. p

p

= 1). La matrice

T = [t

. . . t

. . . t

]

= [t

. . . t

. . . t

] des scores des observations dans la nouvelle

base est telle queT =XP.

Au sens de l'ACP, on construitP de sorte que la représentation réduite minimise l'erreur

de reconstruction de X. Autrement dit, la projection à travers P est optimale si le

critère d'erreur quadratique moyenne MSE(P) (Mean Square Error) d'approximation

des{x

}

à l'aide desdpremières colonnes de cette matrice est minimale.

Sous la contrainte d'orthogonalité deP, et sous l'hypothèse de la nullité de la moyenne

d'une observation x

, le critère MSE(P) est égal à :

M SE(P) =trace( ˆΣ

)−trace(P

Σˆ

P), (3.1)

où Σˆ

est la matrice de covariance empirique des variables de terme général Σˆ

=

cov(x

, x

),cov(x

, x

étant la covariance entre les variablesx

etx

. QuandX est

centrée, cette matrice carré symétrique d'ordre pest égale à

ˆ

Σ

= 1

nX

X. (3.2)

Σ^ˆ

où _Σˆ

est la matrice de covariance empirique des variables de terme général _Σˆ

= ¹

n^X

Comme la matrice de covariance_Σˆ

_Σˆ

, la plus grande valeur propre de _Σˆ

de _Σˆ

. Rappelons que les valeurs propres de _Σˆ

sont positives car _Σˆ

En outre, les valeurs propres de la matrice de covariance_Σˆ