• Aucun résultat trouvé

4.2.1

Origines

Le logiciel R est un logiciel de statistique cr´e´e par Ross Ihaka et Robert Gentleman. Il est `a la fois un langage informatique et un environnement de travail : les commandes sont ex´ecut´ees grˆace `a des instructions cod´ees dans un langage relativement simple, les r´esultats sont affich´es sous forme de texte et les graphiques sont visualis´es directement dans une fenˆetre qui leur est propre.

C’est un clone du logiciel S-plus qui est fond´e sur le langage de programmation orient´e objet, d´evelopp´e par AT et T Bell Laboratories en 1988 . Ce logiciel sert `a manipuler des donn´ees,`a tracer des graphiques et `a faire des analyses statistiques sur ces donn´ees.

4.2.2

l’utilit´e de l’utilisation du logiciel

Tout d’abord R est un logiciel gratuit et `a code source ouvert (open source). Il fonctionne sous UNIX (et Linux), Windows et Macintosh. C’est donc un logiciel multi-plates-formes. Il est

Chapitre 4. Application de l’ACP 63

d´evelopp´e dans la mouvance des logiciels libres par une communaut´e sans cesse plus vaste de b´en´evoles motiv´es.

Tout le monde peut d’ailleurs contribuer `a son am´elioration en y int´egrant de nouvelles fonc- tionnalit´es ou m´ethodes d’analyse non encore impl´ement´ees. Cela en fait donc un logiciel en rapide et constante ´evolution.

C’est aussi un outil tr`es puissant et tr`es complet, particuli`erement bien adapt´e pour la mise en œuvre informatique de m´ethodes statistiques.L’avantage en est toutefois double :

– l’approche est p´edagogique puisqu’il faut maˆıtriser les m´ethodes statistiques pour parvenir `a les mettre en œuvre ;

– l’outil est tr`es efficace lorsque l’on domine le langage R puisque l’on devient alors capable de cr´eer ses propres outils, ce qui permet ainsi d’op´erer des analyses tr`es sophistiqu´ees sur les donn´ees Le logiciel R est particuli`erement performant pour la manipulation de donn´ees, le calcul et l’affichage de graphiques. Il poss`ede, entre autres choses :

– un syst`eme de documentation int´egr´e tr`es bien con¸cu (en englais) ;

– des proc´edures efficaces de traitement des donn´ees et des capacit´es de stockage de ces donn´ees ; – une suite d’op´erateurs pour des calculs sur des tableaux et en particulier sur des matrices ; – une vaste et coh´erente collection de proc´edures statistiques pour l’analyse de donn´ees ; – des capacit´es graphiques ´evolu´ees ;

– un langage de programmation simple et efficace possibilit´es d’entr´ee-sortie.

4.2.3

Les diff´erents packages R utlis´ees

Un package R est un ensemble coh´erent de fonctions, de jeux de donn´ees et de documentation permettant de compl´eter les fonctionnalit´es du syst`eme de base ou d’en ajouter de nouvelles. Les packages sont install´es depuis le site Comprehensive R Archive Network (CRAN) ;

FactoMineR

est un package R d´edi´e `a l’analyse exploratoire multidimensionnelle de donn´ees (`a la Fran¸caise). Il a ´et´e d´evelopp´e et il est maintenu par Fran¸cois Husson, Julie Josse, S´ebastien Lˆe, d’Agrocampus Rennes, et J. Mazet.

- Il permet de mettre en oeuvre des m´ethodes analyses de donn´ees telles que l’analyse en com- posantes principales (ACP), l’analyse des correspondances (AC), l’analyse des correspondances multiples (ACM) ainsi que des analyses plus avanc´ees.

- Il permet l’ajout d’information suppl´ementaire telle que des individus et/ou des variables suppl´ementaires.

- Il fournit un point de vue g´eom´etrique et de nombreuses sorties graphiques.

- Il fournit de nombreuses aides `a l’interpr´etation (description automatique des axes, nombreux indicateurs, ...).

- Il peut prendre en compte diverses structures sur les donn´ees (structure sur les variables, hi´erarchie sur les variables, structure sur les individus).

Chapitre 4. Application de l’ACP 64

- Beaucoup de mat´eriels p´edagogique (MOOC, livres, etc.) est disponible pour expliquer aussi bien les m´ethodes que la fa¸con de les mettre en oeuvre avec FactoMineR.

- Il g`ere les donn´ees manquantes avec missMDA

- Il a une interface Shiny qui permet de construire des graphes de fa¸con interactive avec Factoshiny.

- Il propose une interpr´etation automatique des r´esultats obtenus avec FactoMineR grˆace `a FactoInvestigate .

Factoshiny

C’est une interface graphique qui permet de param´etrer les m´ethodes et de modifier les graphes de fa¸con interactive Il n’est pas n´ecessaire de savoir programmer .L’objet r´esultat de Factoshiny peut ˆetre r´eutilis´e pour modifier les graphes. L’interface est rouverte avec le dernier param´etrage et les derni`eres options graphiques qui peuvent ˆetre modifi´es. permet d’am´eliorer facilement et de fa¸con interactive les graphiques pour les rendre beaucoup plus lisibles.

missMDA

Le package missMDA est compl´ementaire de FactoMineR. Il permet de g´erer les donn´ees manquantes pour les m´ethodes d’analyses. Il permet de faire de l’imputation simple et multiple.

L’imputation simple consiste `a remplacer les valeurs manquantes par des valeurs plausibles. Cela revient `a compl´eter le jeu de donn´ees qui peut ensuite ˆetre analys´e par n’importe quelle m´ethode d’analyse factorielle.

missMDA impute les valeurs manquantes de sorte que les valeurs imput´ees n’ont aucune influence sur les r´esultats de l’analyse factorielle,pas d’influence dans le sens o`u les valeurs imput´ees n’ont aucun poids, et donc les r´esultats de l’analyse factorielle sont obtenues uniquement avec les valeurs observ´ees

Documents relatifs