I
MPORTATION,
EXPORTATION DE DONNÉES ET DE GRAPHIQUESJulie Scholler - Bureau B246
octobre 2019
I. Répertoire de travail
Connaître le répertoire de travail getwd()
Fixer le répertoire de travail setwd("nouveau-répertoire") À la main
• données extérieures sous forme de fichiers
• formats : .txt., .csv, .xls, .xlsx, etc.
Pour les formats : txt et csv
• read.table() ouread.csv()ouread.csv2()
• read_csv(),read_csv2(),read_delim()du package readr Pour les formats : xls et xlsx
• read.xlsx()ouread.xlsx2() du package xlsx
• read_excel() du package readxl
II. Importation de données
Importation de base
df <- read.table(file="fichierdedonnees.txt",
header=FALSE, sep="",dec=".",row.names=-1,...)
• file : chemin vers le fichier (peut être une url)
• header: si la première ligne contient les noms des variables
• sep: caractère utilisé pour séparer les données
• dec: séparateur décimal
• row.names : valeur numérique spécifiant le numéro de la colonne contenant les noms ou numéros d’individus s’il n’y en a pas row.names=-1
read.table(file, header=FALSE, sep="",dec=".") read.csv(file, header=TRUE, sep=",",dec=".") read.csv2(file, header=TRUE, sep=";",dec=",")
II. Importation de données
Importation avec readr
Il faut d’abord avoir installer le packagereadr.
• à utiliser pour importer de (très) gros fichier
• le format de la base de données importée n’est pas un dataframe classique mais untibble
library(readr)
df <- read_csv(path="fichierdedonnees.csv", col_names = TRUE, col_types = NULL,...)
• path : chemin vers le fichier (peut être une url)
• col_names : si la première ligne contient les noms des variables Il existe aussiread_csv2(),read_tsvet read_delim()(pour ce dernier il faut spécifier le séparateur avecdelim).
Formats Excel
Il faut d’abord avoir installer le packagexlsx.
library(xlsx)
read.xlsx(file, sheetIndex, header=TRUE,...)
• sheetIndex : nombre ou nom indiquant la feuille du document à importer
• header: si la première ligne contient les noms des variables
• startRow: numéro de la première ligne comprenant des données (hors noms de variables)
La commanderead_excel()du packagereadxlpermet de spécifier plus préciser les cases à lire.
III. Exportation de données
• données crées ou transformées dans R
• que l’on souhaite enregistrer sous forme de fichiers En format : txt ou csv
• write.table()ouwrite.csv()ou write.csv2() En format : xls ou xlsx
• write.xlsx() ouwrite.xlsx2()du package xlsx
write.table(x, file, sep = " ",
dec = ".", row.names = TRUE, col.names = TRUE)
• x: objet R à écrire dans le fichier
• file : chemin du fichier à créer
• sepet dec: séparateurs de données et séparateur décimal à utiliser dans le fichier créer
• row.names etcol.names : si les noms de ligne et de colonnes sont conservés ou non dans le fichier créé
III. Exportation de données
Autres commandes
write.csv(x, file, sep = ",", dec = ".",
row.names = TRUE, col.names = TRUE) write.csv2(x, file, sep = ";", dec = ",",
row.names = TRUE, col.names = TRUE) library(xlsx)
write.xlsx(x, file, sheetName="Sheet1", col.names=TRUE, row.names=TRUE, append=FALSE)
write.xlsx2(x, file, sheetName="Sheet1",col.names=TRUE, row.names=TRUE, append=FALSE)
• append: si on ajoute la feuille à un nouveau document ou si on crée un nouveau fichier
Pourquoi
• sauvegarder un graphique crée dans R
• utiliser via un autre logiciel pour insertion dans un document
Comment
• à la main via l’interface graphique
• via des commandes (plus précis et plus reproductible)
IV. Exportation de graphiques
Syntaxe de base
pdf(file="nom_souhaité_du_fichier_du_graphique.pdf")
#code de construction du graphique dev.off()
jpeg(file="nom_souhaité_du_fichier_du_graphique.jpg")
#code de construction du graphique dev.off()
png(file="nom_souhaité_du_fichier_du_graphique.png")
#code de construction du graphique dev.off()
Options générales
• height, width: hauteur et largeur de l’image (en pouces pour les pdf, en pixel sinon)
• pointsize : taille de l’écriture sur les graphiques (par défaut 12)
Pour les pdf
• paper : taille du document
• family: famille d’écriture Pour les jpeg
• quality : qualité de l’image/taux de compression (entre 1 et 100, par défaut 75)