TD/TP. ACP
Exercice 1.
On considère un tableau X de donnant les mesures de 50 pays pour les variables suivantes : - sr : eparagne
- pop15 : % de la population de moins de 15 ans - pop75 : % de la population de plus de 75 ans - ddpi : taux de croissance du PIB percapita
On calcule les moyennes et les écarts-type de ces variables et on obtient le tableau suivant : sr pop15 pop75 ddpi
moyenne 10.51 32.58 2.17 3.00 ecart-type 4.44 9.06 1.28 2.84
En diagonalisant la matrice de corrélation on obtient les valeurs propres et les vecteurs propres : values 2.19 1.14 0.59 0.08
vectors
[,1] [,2] [,3] [,4]
[1,] 0.44 0.43 0.77 -0.14 [2,] -0.64 0.22 0.12 -0.73 [3,] 0.61 -0.29 -0.31 -0.67 [4,] 0.15 0.82 -0.54 0.03
1. Quels pourcentages d’inertie sont expliqués par l’axe 1 ? par l’axe 2 ? le premier plan factoriel ? 2. Calculer les corrélations entre les variables et les deux premières composantes factorielles et tracer le
cercle de corrélations. Interpréter.
3. On sait que la coordonnée d’un individus sur un axe factoriel s’écrit sous la forme 𝑎1𝐹𝐿 + 𝑎2𝑅𝑊 + 𝑎3𝐶𝐿 + 𝑎4𝐵𝐷 + 𝑏.
a. Calculer ces coefficients pour le premier axe
b. Calculer la coordonnée sur le 1er axe du Denmark qui possède les coordonnées suivantes Denmark 16.85 24.42 3.93 3.99
Que peut-on dire pour ce pays ?
Exercice 2.
1. Télécharger le package FactoMineR 2. Charger le package
3. Importer le jeu de données temperature.
4. Réaliser l’ACP normé en utilisant l’ensemble des températures des 12 mois ;
5. Quelle est l’inertie brute associée au premier axe factoriel ? Au second axe ? Quelle est l’inertie totale ?Quel est le pourcentage d’inertie associé au premier plan factoriel ?
6. Représenter en un diagramme en bâtons : la décroissance de l’inertie (“éboulis des valeurs propres”) 7. Produire les corrélations des variables avec l’axe 1 et les trier de façon décroissante. Idem pour l’axe 2.
Quelle est la variable la plus corrélée à l’axe 1 ? à l’axe 2 ?
8. Retrouver par le calcul la contribution de la variable la plus corrélée avec l’axe 1.
9. Quel est l’individu dont la qualité de représentation sur le plan (1,2) est la plus élevée ? la moins élevée ? 10. Quel est l’individu ayant le plus contribué à la formation de l’axe 1 ? le moins contribué ?
11. Quel est l’individu ayant le plus contribué à la formation de l’axe 2 ? le moins contribué ?
12. Trouver la valeur de la distance au centre de gravité de Strasbourg à partir de sa qualité de représentation et sa coordonnée le long d’un axe.
13. Réaliser à nouveau l’ACP du tableau des températures en faisant maintenant en plus les variables illustratives quantitatives (supplementary variables) = latitude, longitude, amplitude, moyenne 14. Interpréter les deux premiers axes factoriels.