TD 3
2 mars 2010
1 Consommation alimentaire de diérentes
catégories socio-professionnelles
On reprend dans cette partie lesdonnées relativesàla consommationalimentaire
de diérentes catégories socio-professionnelles étudiées dans les TD précédents.
1. Tracer le dendrogrammeà l'aide lafonction hclust. Quel est l'indice de distance
de distance utilisé par défaut par R?
2. Utiliserledendrogramme pour choisir lenombre K de classes et trouver les
individus qui appartiennentaux diérentes classes.
3. On cherche maintenantà interpréter les diérentes classes
3.a. Utiliserla fonction cutree pour eectuer le regroupement en classe sous R.
3.b. Représenter les individusdans lepremierplan principalde l'ACP en associant
une couleur diérente aux individusdes diérentes classes.Interpréter.
4. On veut maintenant comparer lesrésultats obtenus avec la classication
hiérarchique ascendante (CAH) avec ceux obtenusavec la méthode des moyennes
mobiles (fonctionkmeans sous R).
4.a. Réaliser une classication avec la méthode des moyennes mobiles en
initialisantlecentre des classes avec lescentres des classes obtenus pas CAH.
Comparer avec lesclasses identiés par CAH.
4.b. Réaliserune classication avec laméthode des moyennes mobilesen
initialisantlecentre des classes de manièrealéatoire.Comparer avec lesrésultats
obtenusprécédemment.
2 Pays de l'OCDE
Reprendre les questions précédentes pour les données relatives àl'OCDE.
Le tableausuivantdétaillele nombre d'étudiantsdes Universités de cinqacadémies
inscrits en 2006 dans les cinqlières suivantes : Lettres, Sciences, Médecine, Sport
et I.U.T.
Lettres Sciences Médecine Sport I.U.T.
Bordeaux 12220 6596 7223 357 2239
Lyon 15310 6999 10921 395 3111
Paris 112958 40244 46146 1247 7629
Rennes 8960 6170 4661 279 4013
Toulouse 12125 8233 6653 553 3178
Faire une analyse multivariéeadaptée àces données (avec FactoMineR).
4 Données de température en France
Cet exercice est extrait de l'examen 2008-2009. Lesdonnées sont disponibles à
l'adresse habituelle.Nousnous intéressons àdes données de températuremensuelle
moyenne dans 30villes françaises.L'unité et ledizième de degré. Lesdonnées
pourrontêtre importéessous R avec la commande
> z=read.table("data.txt")
a) Réaliser un analyse en composantes principales (ACP) sur lejeu de données.
1. Quels sont lesindividus? Quelles sont les variables? Quellessont lamatrice
des poids etla métrique utiliséspar défaut par lafonction PCA?
2. Quelle est le pourcentage d'inertieexpliqué par lepremier axe? Par lesdeux
premiers axes? Parles trois premiersaxes? Commenter.
3. Quel individu a laplus forte contribution àl'axe 1? Quel individu a laplus
forte contribution àl'axe 2? On donnera lesvaleurs numériquesassociées à
ces contributions et oncommentera ces résultats.
4. Proposer une interprétationdes deux premiersaxes principaux.
b. Classication. Tracer ledendrogramme.
1. Combien de classes proposez-vous de retenir? Justier votre réponse.
2. Donner les individus appartenant àchacune des classes et interpréter les
résultats obtenus.