[PDF] Manuel complet pour apprendre à utiliser le logiciel Air | Cours informatique

12  10  Download (0)

Texte intégral

(1)

LOGICIEL R

MANUEL

D’APPRENTISSAGE

(2)

GENERALITES

Principe de base : tous les logiciels susceptibles de traiter des données peuvent importer et exporter des données dans des fichiers au format texte c'est-à-dire lisible dans un éditeur de texte quelconque (Bloc-notes, Emacs, Asedit...)

Au démarrage du programme R, une fenêtre appelée R Console s’ouvre ; l'attente de commandes (par défaut, le symbole « > » ) apparaît alors indiquant que R est prêt à exécuter les commandes.

Quelques conseils pour utiliser R

 Pour les données numériques, en cas de chiffre à virgule ne pas oublier de convertir en éciture anglo-saxonne 1,324 -> 1.324 ou utiliser l’option dec= ", " dans la commande read.table().

 Les données manquantes sont représentées par NA sous R.

 Pour les données qualitatives, s’il n’y a que 2 rubriques, on peut utiliser la valeur 1 pour oui et 0 pour non. Dans le cas de plus de 2 modalités, il est nécessaire de spécifier que l’on a des données qualitatives. Une manière est de remplacer par des noms courts ou d’utiliser l’option as.factor.

 Pour ne pas avoir à retaper le code déjà entré, utiliser la touche .  Lorsque vous donnez un nom, évitez les accents, les caractères spéciaux,…

 Pour en savoir plus sur une commande de R taper : ?nomdelacommande (exemple ?chisq.test) .

Avec R, une fonction, pour être exécutée, s'écrit toujours avec des parenthèses, même si elles ne contiennent rien (par exemple ls()). Si l'utilisateur tape le nom de la fonction sans parenthèses, R affichera le contenu des instructions de cette fonction.

(3)

FICHE 1 - PERSONNALISER SON ENVIRONNEMENT R

Pour personnaliser le lancement de R, il faut tout d’abord créer dans un dossier permanent un fichier Rprofile qui permet de contrôler le démarrage de R pour son propre compte.

Créer un dossier permanent, indépendant de tous les dossiers de travail pour gérer ce type d’opération et noter son chemin complet. Exemple : C:\TravailR

Créer dans le dossier permanent un fichier texte ProfilR.txt

Exemple : Supposons que R doive à l’ouverture écrire au niveau de la console : Tongasoa sur R ! Il faut alors taper une seule ligne dans le fichier ProfilR .txt :

print("Tongasoa sur R !")

Sauvegarder et laisser ouvert dans l’éditeur.

Quitter R s’il est ouvert. Placer dans le dossier permanent une copie de votre raccourci de référence et éditer le à nouveau (clic droit, propriétés). Dans le champ cible après l’adresse du programme rajouter un espace puis R_PROFILE="C:\TravailR\ProfilR.txt"

Lancer R avec le raccourci du dossier de référence. Si le raccourci est correctement modifié, on obtient le message désiré.

Les ordres contenus dans le fichier Rprof.txt seront systématiquement exécutés lors du démarrage de R.

Pour afficher le nom du dossier de travail et l’emplacement du fichier ProfilR.txt, écrire dans ProfilR.txt :

cat(paste("Répertoire de travail =",getwd(),"\n"))

cat("Fichier de mon profil R =",Sys.getenv("R_PROFILE"),"\n")

Il est possible d’ajouter dans ProfilR.txt des options qui peuvent sembler être utiles, comme : options(width=80)

options(papersize="a4")

options (digits=4) # On aura dans ce cas, les éditions avec 4 chiffres significatifs.

Le fichier ProfilR.txt sera enrichi avec l’expérience ; il contiendra ainsi des éléments personnels importants disponibles à chaque lancement de R à partir du dossier permanent.

(4)

FICHE 2

-

IMPORTER DES DONNEES

Les manipulations décrites ici ont pour objectif d'assurer les transferts de données saisies sur un logiciel tableur de type Excel vers le logiciel R.

Importer des données de Excel® (ou d'un tableur équivalent) dans R METHODE 1

Dans Excel :

1. Ouvrir le fichier de données,

2. Enregistrer le fichier au format csv (Comma Separated Value) en le spécifiant dans la liste déroulante (Type de fichier, séparateur point-virgule).

Le format csv est lisible dans un éditeur de texte quelconque, sa spécificité réside dans les points-virgules qui séparent les valeurs de colonnes différentes. Il est préférable au format txt qui propose des séparateurs tabulation qu'il est impossible de distinguer à l'oeil d'un espace alors que le codage est différent. Dans une version anglaise d'Excel, le séparateur des colonnes est une virgule, le point étant le séparateur décimal.

3. Quitter Excel. Dans R :

L'importation du fichier de données s'effectue avec la fonction read.table(). L'aide en ligne

(help(read.table)) vous fournira tous les détails sur l'utilisation de cette fonction. On peut en général assurer l'importation avec les 4 arguments : file, header, sep, dec.

• file : nom du fichier qui contient les données avec le chemin pour y accéder,

• header (TRUE ou FALSE) : permet de préciser si la première ligne contient le titre des

colonnes

• sep : permet de préciser le caractère qui délimite les colonnes, • dec : permet de préciser le séparateur décimal

Exemple :

La fonction read.table() permet d'importer, dans un objet à créer (ex : `Mydata '), un tableau de données (dataframe pour R) provenant d'une feuille Excel® sauvée au format CSV (« comma-separated-values », séparateurs point-virgule).

La fonction file.choose() permet de choisir le fichier sans avoir à écrire l’ensemble du chemin. Mydata<-read.table(file.choose(),header=TRUE, sep=";”, dec=”,”)

Attention à la façon de coder les données manquantes. Il faudra que dans l’ensemble de la feuille Excel® les données manquantes aient été codées de la même façon, pour l’ensemble des colonnes. Exemples : toutes les données manquantes ont été codées par 999, la commande R devient alors : Mydata<-read.table(file.choose(),header=TRUE, sep=";”, dec=”,”, na.string=”999”)

Autre exemple :

On souhaite importer le fichier data.csv qui se trouve dans le répertoire "E:\Travail\". La première ligne contient le titre des colonnes. Les valeurs sont séparées par des points-virgules. Le séparateur

(5)

décimal est la virgule. On souhaite stocker le résultat dans une variable Matable. Pour cela, on tape la commande :

Matable<-read.table("E:/Travail/data.csv", header=TRUE, sep=";", dec=",")

(6)

La fonction read.table() et ses attributs

read.table(file, header = TRUE, sep = " ;", quote = "\"'", dec = ",", row.names, col.names, as.is = FALSE, na.strings = "NA", colClasses = NA, nrows = -1, skip = 0, check.names = TRUE, fill = !blank.lines.skip, strip.white = FALSE, blank.lines.skip = TRUE, comment.char = "#")

file

NB : Utiliser la fonction file.choose()

le nom du fichier (entre "" ou une variable de mode caractère), éventuellement avec son chemin d'accès (le symbole \ est interdit et doit être remplacé par /, même sous Windows), ou un accès distant à un fichier de type URL (http://...)

header une valeur logique (FALSE ou TRUE) indiquant si le fichier contient les noms des variables sur la 1ere ligne

sep le séparateur de champ dans le fichier, par exemple sep="\t" si c'est une tabulation

quote les caractères utilisés pour citer les variables de mode caractère

dec le caractère utilisé pour les décimales

row.names un vecteur contenant les noms des lignes qui peut être un vecteur de mode character, ou le numéro (ou le nom) d'une variable du _chier (par défaut : 1, 2, 3, . . .)

col.names un vecteur contenant les noms des variables (par défaut : V1, V2,V3, . . .)

as.is contrôle la conversion des variables caractères en facteur (si FALSE) ou les conserve en caractères (TRUE) ; as.is peut être un vecteur logique, numérique ou caractère précisant les variables conservées en caractère

na.strings indique la valeur des données manquantes (sera converti en NA) colClasses un vecteur de caractères donnant les classes à attribuer aux

colonnes

nrows le nombre maximum de lignes à lire (les valeurs négatives sont ignorées)

(7)

METHODE 2 Dans Excel :

4. Ouvrir le fichier de données,

5. Enregistrer le fichier au format txt (Texte) en le spécifiant dans la liste déroulante (Type de fichier).

6. Quitter Excel. Dans R :

(8)

FICHE 3

EXPORTER

Exporter vers Excel des données traitées avec R

La fonction write.table() permet d'envoyer un jeu de données R dans un fichier texte.

Exemple : On souhaite exporter le jeu de données MyData dans un fichier afin de poursuivre son analyse avec Excel. Pour cela, on précise que le séparateur décimal est la virgule et le séparateur le point-virgule.

write.table(Mydata,"E:/Travail/MyData.csv",sep=";",dec=",")

Puis sous Excel, on ouvre le fichier "MyData.csv" en précisant que le fichier est de type csv. Les arguments et options sont :

write.table(x, file = "", append = FALSE, quote = TRUE, sep = " ", eol = "\n", na = "NA", dec = ".", row.names = TRUE, col.names = TRUE, qmethod = c("escape", "double"))

x le nom de l'objet R à exporter

file le nom du fichier final (par d_efaut l'objet est a_ch_e _a l'_ecran)

append si TRUE ajoute les données sans effacer celles éventuellement existantes dans le fichier final

quote une variable logique ou un vecteur numérique : si TRUE les variables de mode caractère et les facteurs sont écrits entre " ", sinon le vecteur indique les numéros des variables à écrire entre guillemets (dans les deux cas les noms des variables sont écrits entre guillemets mais pas si quote = FALSE)

sep le séparateur de champ dans le fichier final

eol le caract_ere imprim_e _a la _n de chaque ligne ("nn" correspond _a un retourcharriot)

na indique le caract_ere utilis_e pour les donn_ees manquantes dec le caract_ere utilis_e pour les d_ecimales

row.names une variable logique indiquant si les noms des lignes doivent ^etre _ecrits dans le _chier

col.names idem pour les noms des colonnes

qmethod spécifie si quote=TRUE, comment sont traitées les guillemets doubles " incluses dans les variables de mode caractère : si "escape" (ou "e", par défaut) chaque " est remplacée par n\", si "d" chaque " est remplacée par ""

Pour enregistrer des objets lisible par R, on utilisera la commande save()

save(Mydata, file="Mydata.RData")

Pour faciliter l'échange de fichiers entre machines et systèmes d'exploitation, on peut utiliser l'option ascii=TRUE.

Les données (qui sont alors nommées workspace dans le jargon de R) peuvent ultérieurement être chargées en mémoire avec load () : load("Mydata.RData")

La fonction save.image() est un raccourci pour remplacer l’expression suivante :

(9)
(10)

FICHE 4 - SELECTION DU REPERTOIRE DE TRAVAIL

La fonction getwd() permet d’identifier le répertoire de travail par défaut. En cas d’utilisation de la fiche 1, « Personnaliser son environnement R », la fonction getwd() est déjà dans le fichier ProfileR.txt, et le répertoire de travail est alors affiché dans la fenêtre de la ConsoleR.

Pour modifier le répertoire de travail, il faut utiliser la fonction setwd().

La commande setwd(dirname(file.choose())) permet d’ouvrir une fenêtre pour choisir le répertoire de travail et permet ainsi d’éviter à avoir à écrire le chemin complet du répertoire dans lequel les fichiers issus de l’analyse sous R seront sauvegardés.

Bien que la fonction file.choose() soit utilisée dans cette commande, aucun fichier ne sera ouvert mais par contre il faudra s’assurer que le répertoire de travail choisi contienne au moins un fichier avant d’utiliser cette commande.

(11)

FICHE 5

FICHIER SCRIPT

Un fichier script vous permet d’écrire plusieurs commandes à la fois (sans le symbole

>) et de ne les exécuter que lorsque vous les avez toutes écrites. Pour obtenir les résultats une fois que vous avez fini d’écrire vos commandes copier et coller vos commandes dans le shell où est exécuté R ou bien utiliser la commande source(fichier).

Essayer de faire (et exécuter) un fichier script avec les commandes suivantes (exemple précédent) : 7 Premiers pas ... 4

a<-c(2,4,6) b<-c(3,5,7); y<-cbind(a,b); z<-rbind(a,b) ; y ; z;

(12)

FICHE 6 - UTILISER UNE EXTENSION (PACKAGE)

1- Installer un package

A partir d’un site miroir :

Si le fichier.zip n’est pas disponible dans un répertoire, il faut dans un premier temps télécharger l’extension à partir d’un site miroir de CRAN. Dans les menu de la fenêtre R, cliquer sur le menu Packages et choisir l’option Installer le(s) package(s). Le programme demande de choisir un dépôt des ressources de si vous ne l’avez pas encore fait par l’option « Choisir le site miroir de CRAN » et va chercher sur ce dépôt la liste des packages disponibles pour la version de R utilisée.

Exemple : Cherchez l’extension xlsreadwrite.zip.

NB : Le téléchargement et l’installation dans votre dossier R est automatique. A partir d’un fichier .zip déjà téléchargé mais non installé

Dans les menu de la fenêtre R, cliquer sur le menu Packages et choisir l’option Installer le(s) package(s) depuis des fichiers zip. Dans la fenêtre qui s’ouvre, rechercher le dossier

qui contient les librairies au format zip, et cherchez dans la liste le nom

qui commence par tripack. Ce nom comporte un numéro de version (figure 2.1). Le décompactage et l’installation dans votre dossier rw2020 est automatique. 2- Charger un package

Pour la durée d’une session de travail, pour utiliser une extension (package) déjà installé, il faut la charger. Pour ce faire il faut utiliser la fonction library().

Figure

Updating...

Références

Updating...