• Aucun résultat trouvé

Soit le tableau de données

N/A
N/A
Protected

Academic year: 2022

Partager "Soit le tableau de données"

Copied!
3
0
0

Texte intégral

(1)

Master Océanographie, 1

ere`

année Méthodes Quantitatives

T.D. n° IV - Quelques applications

Exercice 1

Soit le tableau de données

X = √ 10

2 2 3 3 1 2 1 0 3 2 1 4 2 1 3

correspondant à des observations eectuées sur 5 individus de poids statistiques égaux pour les trois variable T

1

, T

2

et T

3

. On veut eectuer une ACP centrée-réduite sur ce tableau.

1. Calculer l'individu moyen, le vecteur (σ

1

, σ

2

, σ

3

)

0

des écart-types des variables et la matrice X

cr

des données centrées- réduites.

2. Calculer la matrice des corrélations R .

3. Eectuer la décomposition aux valeurs propres de R . En déduire les composantes principales.

4. Représenter les plans factoriels (1, 2) pour les variables et les individus. Donner une interprétation de l'ACP.

Exercice 2

Soit la matrice X =

x

1

, x

2

, x

3

dont les variables ont pour corrélation

R =

1 ρ −ρ

ρ 1 ρ

−ρ ρ 1

avec −1 ≤ ρ ≤ 1 . On va eectuer l'ACP centrée réduite de X . 1. Vérier que R admet pour vecteur propre ξ

1

=

1

3

(1, −1, 1)

0

. 2. Déterminer les autres éléments propres de cette matrice.

3. Quelles sont les valeurs possibles de ρ ? On se placera ensuite dans le cas où −1 ≤ ρ < 0 . 4. Calculer les pourcentages de variance expliquée et tracer l'éboulis des valeurs propres.

5. Comment s'interprète en fonction des variables, l'unique composante principale à retenir dans cet exemple?

Corrections Exercice 1

1. L'individu moyen est obtenu en faisant la moyenne des colonnes du tableau X , soit x ¯ = √

10 (2, 1, 3)

0

. On obtient, en soustrayant ce vecteur à chaque ligne du tableau, le tableau centré

X

c

= √ 10

0 1 0

1 0 −1

−1 −1 0

0 0 1

0 0 0

 .

1

(2)

Le vecteur (σ

1

, σ

2

, σ

3

)

0

est donné par la racine carrée de trace de la matrice de variance covariance

V = X

0c

D

p

X

c

= 10 5

2 1 −1

1 2 0

−1 0 2

soit (σ

1

, σ

2

, σ

3

)

0

= (2, 2, 2)

0

, où la matrice D

p

correspond à la métrique diagonale des poids, soit

15

sur la diagonale.

On en déduit la matrice des données centrées réduites de terme général x

crij

=

xijσ−¯xj

j

X

cr

=

√ 10 2

0 1 0

1 0 −1

−1 −1 0

0 0 1

0 0 0

 .

2. La matrice de corrélation est donnée par

R = X

0cr

D

p

X

cr

= 10 20

2 1 −1

1 2 0

−1 0 2

 =

1

12

12

1

2

1 0

12

0 1

 .

Cette matrice correspond à une matrice de variance particulière calculée sur un tableau centré réduit.

3. Faire l'ACP du tableau centré réduit correspond à diagonaliser la matrice R . On cherche donc à résoudre le problème aux valeurs propres

RA = AΛ

où A est la matrice des vecteurs propres et Λ = diag (λ

1

, λ

2

, λ

3

) est la matrice diagonale des valeurs propres. On commence par résoudre det (R − λI) = 0 et on obtient l'équation

(1 − λ)

1 − λ + 1

√ 2 1 − λ − 1

√ 2

= 0.

On obtient donc 3 valeurs propres λ

1

= 1 +

√2

2

, λ

2

= 1, λ

3

= 1 −

√2

2

. Il faut maintenant trouver les vecteurs propres correspondants à chaque valeur propre en résolvant

Ra = λa

et on trouve a

1

=

12

2, 1, −1

0

, a

2

=

1

2

(0, 1, 1) et a

3

=

12

2, −1, 1

0

. Attention, ces vecteurs propres ont été normalisés pour être de norme unité pour la métrique M , c'est à dire ka

j

k

M

= a

0j

Ma

j

= 1 . Ici, la métrique M = I , mais attention de travailler avec le tableau centré réduit. On vériera également qu'ils sont orthogonaux deux à deux a

0k

Ma

j

= 0, k 6= j . On en déduit les composantes principale

c

1

= X

cr

a

1

==

√ 10

4

1, 1 + √

2, −1 − √

2, −1, 0

0

c

2

= X

cr

a

2

=

√ 20

4

(1, −1, −1, 1, 0)

0

c

3

= X

cr

a

3

=

√10 4

−1, √

2 − 1, 1 − √ 2, 1, 0

0

.

On vérie que ces composantes principales sont orthogonales deux à deux pour la métrique D

p

, c'est à dire que c

k0

D

p

c

j

= 0, k 6= j et que leur D

p

-norme est telle que

c

j

2

Dp

= λ

j

.

4. Les coordonnées des points sont données par les composantes principales. Les coordonnées des variables sur le j

`eme

axe sont données par v

j

= √

λ

i

a

j

dans ce cas. Les variables v

j

sont de M -norme telle que kv

j

k

2M

= λ

j

et orthogonales deux à deux également. Dans ce cas particulier (travail avec la matrice de corrélation) les coordonnées des variables sont directement les corrélations entre les axes principaux et les diérentes variables. On peut également tracer le cercle des corrélation puisque les variables sont de norme unité (elles sont donc située dans un cercle de rayon 1 lorsqu'elles sont projetées). Plus une variable sera proche de ce cercle, mieux elle sera représentée dans le plan de où l'on observe sa projection. Dans ce cas, la variable v1 est inféodée à l'axe 1, la variable v2 est également bien représentée dans le plan.

2

(3)

3

Références

Documents relatifs

Le crocodile Animal équilibriste La figure suivante est à faire sur la feuille ci-jointe. Nommer K', son autre extrémité. 11) Tracer en pointillés le cercle de centre M et de

En chacun des points de ce parcours, sa planche reste en contact avec la &#34; courbe &#34; c'est à dire qu'elle est tangente à la courbe en chacun de ses points : ainsi la pente de

Tracer la droite perpendiculaire à (BC) qui passe par B. Elle coupe [Ay) en E.. Tracer la droite perpendiculaire à (BC) qui passe

Exercice 2 (8 points) Les calculs devront être expliqués et posés sur la

[r]

mais j’ai vu que la construction pouvait être démontrée très-briève- ment, sans rien emprunter de la théorie des suites dont les termes. sont des puissances

Il résulte de ce théorème-une majoration d^une fonction ho lo- morphe y-valente dans le cercle unité, et une majoration d^une branche quelconque du logarithme d^une fonction

Question bonus : Que peut dire du quadrilatère AEBF si les rayons des deux cercles sont les