ESP GI-4 Analyse de données Sidi Mohamed Maouloud
TP. Analyse Factorielle des Correspondances
Le fichier etude.txt contient le tableau de contingence des variables « filière du bac » et « orientation post-bac ». Les modalités de la variable en ligne sont "A : lettre", "BDD : maths-science-éco", "CE : maths-physique", "Tech : technique" et celle de la variable en colonne sont "univ : université",
"prepa : classes préparatoires", "autre : IUT"
1. Importer les données en précisant que le fichier contient les noms des colonnes et les noms des lignes.
2. Transformer en une matrice puis en une table à l’aide des fonctions as.matrix et as.table 3. Utiliser les fonctions prop.table et addmargins pour calculer les tables suivantes :
- Table des effectifs avec les effectifs marginaux - Table des fréquences
- Table des fréquences avec les fréquences marginales - Table des profils lignes
- Table des profils colonnes
4. Partager la fenêtre graphique en 4 à l’aide de la fonction par(mfrow=c(2,2)) 5. Représenter par des diagrammes en bâtons les quatre profils-ligne. Commenter
for(i in 1 :4){
barplot(prop.table(etude,1)[i,],names.arg=colnames(etude),
col="purple3", border="white", main=rownames(etude)[i], horiz=T, las=1, xlab="fréquences",cex.lab=1.2)}
6. Même question pour les profils colonnes.
7. La fonction chisq.test permet de réaliser le test d’indépendance du chi-deux. Créer un objet à l’aide de cette fonction. Pour savoir quels sont les résultats fournis par ce test,
- utiliser la fonction summary
- Extraire des résultats de ce test : la statistique de test puis les mesures d’association en cas d’indépendance.
8. Effectuer l’analyse factorielle des correspondances (AFC) du tableau etude 9. Déterminer les valeurs propres.
10. Retrouver l’inertie totale de deux façons : - à partir du test du chi-deux;
- en calculant la somme des inerties de tous les axes factoriels issus de l’AFC.
11. Produire le premier plan factoriel (axes 1 et 2) des lignes seulement 12. Produire le premier plan factoriel des colonnes seulement.
13. Produire le premier plan factoriel avec les lignes et les colonnes.
14. Quelle est la modalité ligne ayant le plus fortement contribué à la construction de l’axe 1 ? de l’axe 2 ? Pour obtenir les contributions triées par ordre décroissant des axes 1 et 2, on peut soumettre la fonction sort
15. Faire de même pour les modalités colonnes.
16. Quels sont les filières et les orientations ayant le plus fortement contribué à l'inertie globale ? 17. Interpréter les axes factoriels 1 et 2.