I
MPORTATION,
EXPORTATION DE DONNÉES ET DE GRAPHIQUESJulie Scholler - Bureau B246
octobre 2020
I. Répertoire de travail
Connaître le répertoire de travail getwd()
Fixer le répertoire de travail setwd("nouveau-répertoire") À la main
II. Importation de données
• données extérieures sous forme de fichiers
• formats : .txt., .csv, .xls, .xlsx, etc.
Pour les formats : txt et csv
• read.table() ou read.csv() ou read.csv2()
• read_csv(), read_csv2(), read_delim() du package readr
Pour les formats : xls et xlsx
• read_excel() du package readxl
• read.xlsx() ou read.xlsx2() du package xlsx
(nécessite Java et le lien Java/R peut être compliqué parfois)
II. Importation de données
• données extérieures sous forme de fichiers
• formats : .txt., .csv, .xls, .xlsx, etc.
Pour les formats : txt et csv
• read.table() ou read.csv() ou read.csv2()
• read_csv(), read_csv2(), read_delim() du package readr Pour les formats : xls et xlsx
• read_excel() du package readxl
• read.xlsx() ou read.xlsx2() du package xlsx
(nécessite Java et le lien Java/R peut être compliqué parfois)
II. Importation de données
Importation de base
df <- read.table(file="fichierdedonnees.txt",
header=FALSE, sep="",dec=".",row.names=-1,...)
• file : chemin vers le fichier (peut être une url)
• header : si la première ligne contient les noms des variables
• sep : caractère utilisé pour séparer les données
• dec : séparateur décimal
• row.names : valeur numérique spécifiant le numéro de la colonne contenant les noms ou numéros d’individus
s’il n’y en a pas row.names=-1
II. Importation de données
read.table(file, header=FALSE, sep="",dec=".") read.csv(file, header=TRUE, sep=",",dec=".") read.csv2(file, header=TRUE, sep=";",dec=",")
II. Importation de données
Importation avec readr
Il faut d’abord avoir installer le package readr.
• à utiliser pour importer de (très) gros fichier
• le format de la base de données importée n’est pas un dataframe classique mais un tibble
library(readr)
df <- read_csv(path="fichierdedonnees.csv", col_names = TRUE, col_types = NULL,...)
• path : chemin vers le fichier (peut être une url)
• col_names : si la première ligne contient les noms des variables Il existe aussi read_csv2(), read_tsv et read_delim() (pour ce dernier il faut spécifier le séparateur avec delim).
II. Importation de données
Formats Excel
Il faut d’abord avoir installer le package readxl.
library(readxl)
read_excel(path, sheet = NULL, col_names = TRUE, range = NULL, skip = 0)
• sheet : nombre ou nom indiquant la feuille du document à importer
• col_names : si la première ligne contient les noms des variables, si non on peut aussi les spécifier
• skip : nombre de lignes à ignorer avant de lire les données, les lignes vides sont automatiquement ignorées
• range : cellules à lire, par exemple : B3:D87
III. Exportation de données
• données crées ou transformées dans R
• que l’on souhaite enregistrer sous forme de fichiers En format : txt ou csv
• write.table() ou write.csv() ou write.csv2() En format : xls ou xlsx
• write_xlsx() du package writexl
III. Exportation de données
write.table(x, file, sep = " ",
dec = ".", row.names = TRUE, col.names = TRUE)
• x : objet R à écrire dans le fichier
• file : chemin du fichier à créer
• sep et dec : séparateurs de données et séparateur décimal à utiliser dans le fichier créer
• row.names et col.names : si les noms de lignes et de colonnes sont conservés ou non dans le fichier créé
III. Exportation de données
Autres commandes
write.csv(x, file, sep = ",", dec = ".",
row.names = TRUE, col.names = TRUE) write.csv2(x, file, sep = ";", dec = ",",
row.names = TRUE, col.names = TRUE) library(writexl)
write_xlsx(x, path, col_names = TRUE)
• x : peut être un seul tableau de données ou une liste, dans ce dernier cas, le fichier de sortie sera composé de plusieurs feuilles
IV. Exportation de graphiques
Pourquoi
• sauvegarder un graphique crée dans R
• utiliser via un autre logiciel pour insertion dans un document
Comment
• à la main via l’interface graphique
• via des commandes (plus précis et plus reproductible)
IV. Exportation de graphiques
Syntaxe de base
pdf(file="nom_souhaité_du_fichier_du_graphique.pdf")
#code de construction du graphique dev.off()
jpeg(file="nom_souhaité_du_fichier_du_graphique.jpg")
#code de construction du graphique dev.off()
png(file="nom_souhaité_du_fichier_du_graphique.png")
#code de construction du graphique dev.off()
IV. Exportation de graphiques
Options générales
• height, width : hauteur et largeur de l’image (en pouces pour les pdf, en pixel sinon)
• pointsize : taille de l’écriture sur les graphiques (par défaut 12)
Pour les pdf
• paper : taille du document
• family : famille d’écriture Pour les jpeg
• quality : qualité de l’image/taux de compression (entre 1 et 100, par défaut 75)