• Aucun résultat trouvé

Comme nous l’avons vu précédemment, le type de tableau de données soumis à une analyse géométrique détermine le type de méthode à utiliser : AC, ACP ou ACM. Dans la suite, chaque ligne de ce tableau est qualifiée d’unité statistique ou d’individu statistique.

Pour chacune de ces méthodes, une distance (euclidienne) entre les unités statistiques est définie : distance du χ2 pour l’AC, distance usuelle pour l’ACP, distance basée sur l’inverse des fréquences des catégories pour l’ACM1. La distance choisie permet de construire un

nuage de N points dans un espace affine euclidien de dimension K. Ces méthodes consistent à déterminer les axes principaux de ce nuage et sont basées sur la propriété mathématique de la décomposition en valeurs singulières d’une application linéaire (ou la diagonalisation de l’endomorphisme symétrique associé). Nous donnons les deux formulations, géométrique et matricielle, de ce procédé (la décomposition en valeurs singulières a été présentée, pour des matrices rectangulaires, par Eckart et Young en 1936 [25]2).

Nuage étudié. Soit I = {1, . . . , i, . . . , N } l’ensemble indexant les unités statistiques (ou individus). Chaque individu i peut être représenté par un point Mi à valeur dans un espace affine euclidien U de dimension K, soit V l’espace vectoriel directeur de U muni du produit scalaire noté h.|.i et de la norme euclidienne associée. Notons M le support affine du nuage et L le sous–espace vectoriel associé, de dimension L (L ≤ K). L’importance accordée à chaque point du nuage peut être variable, par conséquent, à chaque point Mi est associée une masse ni, la somme des masses des points du nuage est notée n3.

Directions principales. Le but est ici d’approcher le nuage MI = (MI)

i∈I, de dimension

L, par un nuage de dimension L0 (avec L0 < L). Pour ce faire, on recherche les L0 premières directions d’« allongement maximum » du nuage : les L0 meilleures directions principales (au sens des moindres carrés). Le nuage projeté sur le sous–espace engendré par ces L0directions, appelé sous–espace principal de dimension L0, reconstitue « au mieux » les distances entre les points, il fournit donc le meilleur ajustement du nuage MI par un nuage de dimension

L0. Dans la suite, nous resteignons le nuage MI à son support M.

Les L directions principales du nuage MI sont associées aux vecteurs propres de l’endo- morphisme de covariance symétrique et positif Som associé au nuage MI (cf. chapitre 1 p.16 pour une définition de Som).

Théorème 1.1 (Directions principales). Les vecteurs directeurs des droites principales du

nuage MI, notés (−α`)`=1,...,L, sont les vecteurs propres de l’endomorphisme Som, associés aux

valeurs propres λ`.

∀` = 1, . . . L : Som(−α`) = λ`−→α`

Pour une démonstration de ce théorème, se reporter à Benzécri (1984 [6]) ou à Rouanet & Le Roux (1993 [74]).

Soit L = {1, . . . , `, . . . , L}4. L’axe passant par G et de vecteur directeur −α

` est noté (G, −→α`), c’est le `–ème axe principal. Le nuage AI` est le nuage projeté du nuage MI sur

1. Se reporter à Le Roux & Rouanet (2004 [50]) ou à Lebart, Morineau & Piron (1995 [54]) pour le détail des distances utilisées.

2. Généralisation des travaux sur les matrices carrées de Sylvester en 1889 [83]. 3. Nous utilisons ici les notations du chapitre 1.

4. L’ensemble et son cardinal sont identifiés par la même lettre, l’ensemble en italique et son cardinal en lettre droite.

coordonnées des points du nuage A` sur l’axe (G, ||−α

`||), sa variance est égale à λ`.

Propriété 1.1. Si λ` 6= λ`0, les `–ème et `0–ème variables principales sont non–corrélées.

Décomposition principale. Le nuage MI peut être décomposé en L nuages principaux unidimensionnels orthogonaux grâce à la formule suivante :

∀i ∈ I : −−→GMi = L X `=1 −→ GAi` D’après la propriété 1.1, on a : −→ GAi` ⊥−→GAi`0, pour ` 6= `0

On en déduit que la variance du nuage est égale à la somme des variances des L nuages principaux (AI`)`=1,...L, donc à la somme des L valeurs propres.

Remarque : La démarche reste la même dans le cas de valeurs propres multiples ; il n’y

a plus alors unicité des axes principaux correspondants mais un choix d’axes principaux orthogonaux deux à deux peut toujours être fait.

Si les valeurs propres de Som : λ1. . . , λl. . . , λL, sont ordonnées de façon décroissante, le sous–espace principal de dimension L0 cherché est défini par la propriété d’hérédité suivante :

Propriété 1.2 (Propriété d’hérédité). Le sous–espace principal de dimension L0est engendré par les L0 premiers axes principaux : (G, −α1), . . ., (G, −α`), . . ., (G, −→αL0).

Ajustement du nuage MI :

Le nuage projeté du nuage MI dans le sous–espace principal de dimension L0 est noté MfI,

il fournit le meilleur ajustement par un nuage de dimension L0 du nuage MI (au sens des moindres carrés) : ∀i ∈ I : −−→GMfi = L0 X `=1 −→ GAi`

On dit aussi que l’on effectue la reconstitution d’ordre L0 du nuage MI.

Formulations matricielles simples. Comme nous l’avons vu, la procédure centrale des méthodes d’analyse géométrique est la diagonalisation de l’endomorphisme symétrique Som. Or la matrice d’un endomorphisme symétrique, dans une base orthonormée, est symétrique. Par conséquent, si l’on munit l’espace vectoriel L d’un repère orthonormé (G, (−ε`)`∈L), on peut donner des formulations matricielles de la recherche des axes principaux en dimension finie.

Notons X = [xi`]

i∈I,`∈L la matrice à N lignes et L colonnes contenant les coordonnées des points du nuage MI dans le repère orthonormé (G, (−ε`)`∈L). De même, notons F la matrice diagonale d’ordre N dont les éléments diagonaux sont les fréquences (ni/n)i∈I. On dit que les colonnes de X représentent les variables coordonnées.

Soit V la matrice de covariance entre les L variables coordonnées : V = X0FX ; V est

également la matrice associée à l’endomorphisme Som dans le repère orthonormé (G, (−ε`)`∈L), elle est symétrique et définie positive. Chercher les vecteurs propres de l’endomorphisme Som revient donc à chercher les vecteurs propres (a`)`∈Lde la matrice V, c’est–à–dire définis par :

Va` = λ`a`

avec (λ`)`∈L, les valeurs propres associées, ordonnées de façon décroissante. Pour faciliter l’exposé, nous prenons ici des vecteurs normés :

∀` ∈ L, a`0a` = 1

Remarque : Dans le repère orthonormé (G, (−ε`)`∈L), les vecteurs–colonnes (a`)`∈L repré- sentent les coordonnées des vecteurs (−→α`)`∈L normés définis précédemment.

Le vecteur colonne y` représentant la `–ème variable principale calibrée est tel que :

y` = Xa`

Approximation de la matrice X :

Toute matrice X de rang L peut être écrite comme une somme de produits de matrices de rang 1. Cependant, la décomposition en valeurs singulières suivante est unique :

X =X `∈L Xa` a0` = X `∈L y` a0`

Eckart et Young (1936 [25]) montrent que la meilleure approximation d’une matrice de rang L par une matrice de rang L0(< L) est obtenue en se restreignant aux L0 premiers termes de la somme : f X = X `∈L0 Xa` a0`= X `∈L0 y` a0` (= X `∈L0 q λ` y`λ` a`0)

On dit aussi que l’on effectue la reconstitution d’ordre L0 de la matrice X.

2

Analyses sur tableaux à trois entrées

La décomposition en valeurs singulières, sous–jacente à l’ensemble des méthodes d’analyse géométrique des données, ne se généralise pas directement au cas des tableaux à plus de deux entrées : les tableaux multiples. Pour pallier ce problème, plusieurs solutions ont été proposées, elles s’inscrivent soit dans le cadre de la modélisation multi–tableaux (comme par exemple dans Kroonenberg, 1989 [46]), soit dans le cadre géométrique (cf. Cazes, 2004 [13]). Nous donnons ici un bref aperçu des solutions proposées.

L’exposé est basé, sans perte de généralité, sur les tableaux à trois dimensions, le cas multiple en est une simple extension.

On ne dispose plus d’un tableau (ou matrice) X à N lignes et L colonnes mais d’un ensemble de T tableaux (matrices) à N lignes et L colonnes : X1, X2, . . ., XT. L’ensemble des T matrices forme un tenseur d’ordre 3, de taille N × L × T , noté X (figure B.1 ci–après). Notons T = {1, . . . , t, . . . , T } l’ensemble indexant les T matrices.

Figure B.1 – Tenseur d’ordre 3.