ESP GI-4 Analyse de données Sidi Mohamed Maouloud
TP Analyse Factorielle Discriminante Partie 2
Le jeu de données iris disponible dans R comprend un total de 150 observations, réparties de manière égale entre les trois espèces de fleurs d’iris (setosa, virginica et versicolor). Quatre caractéristiques sont mesurées pour chaque observation : la longueur et la largeur du sépale et du pétale, en centimètres.
1. Charger le jeu de données iris
2. Charger la librairie MASS et utiliser l’aide pour comprendre la fonction lda, ses entrées et ses sorties.
3. Effectuer une AFD avec la fonction lda sur le jeu de donnée iris 4. Calculer les coordonnées des individus sur le plan factoriels
5. Calculer les corrélations entre variables initiales et composantes factorielles
6. Effectuer un tracer des individus sur le plan factoriel. Utiliser une couleur différente par groupe 7. Commenter le graphique précédent
8. Calculer les distances séparant chaque individu aux centres de gravité des classes.
9. Prévoir une classe pour chaque individu et donner la matrice de confusion 10. Identifier les individus mal classés
11. Calculer les coordonnées des centres de gravité sur les axes factoriels 12. Tracer les centres de gravité sur le plan factoriel
13. Identifier sur le graphique les individus mal classés
14. Utiliser la fonction predict pour déterminer des classes pour l’ensemble des individus. Donner la matrice de prévision
15. Identifier les individus mal classé et calculer leurs probabilités à posteriori
16. La procédure de Cross-validation Leave-one-out détermine une classe pour chaque individu en utilisant une AFD effectué sur les autres individus. Utiliser cette procédure pour classer les individus
17. Déterminer les mal classés
18. Partager le jeu de données en 2 parties une de 60 et l’autre de 90 en utilisant un tirage aléatoire.
On appelle la première train et l’autre test 19. Effectuer une AFD sur le jeu train
20. Prédire les classes des autres et déterminer la matrice de confusion ainsi que l’erreur de classement
21. Utiliser une qda pour faire la même chose