P
RÉSENTATION GÉNÉRALE DER
Julie Scholler - Bureau B246
septembre 2020
I. Présentation
I. Présentation
R
• langage orienté vers le traitement de données et l’analyse statistique
• logiciel libre publié sous licence GNU GPL
Logiciel libre
• respecte la liberté des utilisateurs
• les utilisateurs ont la liberté d’exécuter, copier, distribuer, étudier, modifier et améliorer ces logiciels.
R
• langage orienté vers le traitement de données et l’analyse statistique
• logiciel libre publié sous licence GNU GPL
Logiciel libre
• respecte la liberté des utilisateurs
• les utilisateurs ont la liberté d’exécuter, copier, distribuer, étudier, modifier et améliorer ces logiciels.
I. Présentation
Usages
• statistiques descriptives : moyenne, médiane, variance, etc.
• tests d’hypothèses et intervalles de confiance
• régressions linéaires, analyse factorielle, machine learning
• graphiques
• rapports/documents intégrant du code R, des tableaux et graphiques via du code R
Pourquoi utiliser R ?
Avantages
• multiplateforme (Linux, Mac OS X, Windows)
• gratuit
• très puissant car les fonctionnalités de base peuvent être étendues à l’aide d’extensions (plus de 10 000)
• possibilités de manipulation de données supérieures à un tableur
• bonnes capacités graphiques et nombreuses possibilités d’export
• les méthodes statistiques récentes sont rapidement disponibles
• création intégrée de documents (pdf, html, etc.)
• communauté d’utilisateurs et de développeurs très active et réactive
• beaucoup d’aide, d’informations et de forum à ce propos sur le web
I. Présentation
Inconvénients
• logiciel et documentation de base en anglais (mais de plus en plus de ressources en ligne en français)
• R s’apparente davantage à un langage de
programmation qu’à un logiciel proprement dit
Allison Horst
I. Présentation
Productions d’étudiants
• Format PDF : dossier d’analyse des ventes de jeux vidéos par Denis Charles, Timothy Hervier et Valentin Bonneau (ancien M1 Mécen)
• Format HTML : Diot, Fuchez, Chaveneau (anciens L3), Dhorbait, Corre et Feteira (anciens L3), empreinte écologique par Grégoire Amato et Camille Philippe (ancien L3)
• Applications plus évolués : analyse de vente de liqueurs par Naoufel Oubaha (ancien M2 Mécen)
• Divers : production des Mécen
Allison Horst
II. Installation
Logiciel R
http://www.r-project.org/
• rubriqueDownload, cliquer surCRAN
• choisir un site miroir en France
• choisir la version en fonction de votre système d’exploitation (pour Linux, il y a de fortes chances que R soit directement disponible via le gestionnaire de paquets)
Logiciel R
http://www.r-project.org/
• rubriqueDownload, cliquer surCRAN
• choisir un site miroir en France
• choisir la version en fonction de votre système d’exploitation (pour Linux, il y a de fortes chances que R soit directement disponible via le gestionnaire de paquets)
II. Installation
Logiciel R
http://www.r-project.org/
• rubriqueDownload, cliquer surCRAN
• choisir un site miroir en France
• choisir la version en fonction de votre système d’exploitation (pour Linux, il y a de fortes chances que R soit directement disponible via le gestionnaire de paquets)
Interface RStudio
https://www.rstudio.com/
• cliquer sur Download RStudiodans le caroussel
• choisir la versionfree deRStudio Desktop
• choisir la version en fonction de votre système d’exploitation (pour Linux, il y a des chances que RStudio soit directement disponible via le gestionnaire de paquets)
II. Installation
Interface RStudio
https://www.rstudio.com/
• cliquer sur Download RStudiodans le caroussel
• choisir la versionfree deRStudio Desktop
• choisir la version en fonction de votre système d’exploitation (pour Linux, il y a des chances que RStudio soit directement disponible via le gestionnaire de paquets)
Interface RStudio
https://www.rstudio.com/
• cliquer sur Download RStudiodans le caroussel
• choisir la versionfree deRStudio Desktop
• choisir la version en fonction de votre système d’exploitation (pour Linux, il y a des chances que RStudio soit directement disponible via le gestionnaire de paquets)
III. RStudio
À l’ouverture de RStudio, la fenêtre se partage ainsi :
III. RStudio
À l’ouverture de RStudio, la fenêtre se partage ainsi :
Console Aide, fenêtre graphique, fichiers, packages
III. RStudio
À l’ouverture de RStudio, la fenêtre se partage ainsi :
Console
Aide, fenêtre graphique, fichiers, packages
Scripts Données, historique
III. RStudio
À l’ouverture de RStudio, la fenêtre se partage ainsi :
Console
Aide, fenêtre graphique, fichiers, packages
III. RStudio
À l’ouverture de RStudio, la fenêtre se partage ainsi :
Console Aide, fenêtre graphique, fichiers, packages
Scripts
Données, historique
III. RStudio
À l’ouverture de RStudio, la fenêtre se partage ainsi :
Console Aide, fenêtre graphique, fichiers, packages
Données, historique
III. RStudio
Début avec R
• R est une calculatrice
• création d’objet
• utilisation d’un script
• différents types d’objets
IV. Premières manipulation
Mode d’un objet
Les principaux modes d’un objet de R sont
• numeric (valeur numérique) : 1,pi,3.1416
• logical (booléen, valeur logique) : TRUE,FALSE,T,F
• character (chaîne de caractères) :"blabla"
Commande autour du mode d’un objet
• connaître le mode d’un objet x:mode(x)
• tester l’appartenance d’un objet à un mode en particulier : is.numeric(x), etc.
• convertir un objet d’un mode à l’autre : as.character(x)
Structures de données
Vecteur
• ensemble de valeurs toutes du même mode (numérique, logique, etc.)
Matrice
• tableau de valeurs toutes du même mode (numérique, logique, etc.)
Facteur
• vecteur adapté aux données qualitatives
Data frame
• tableau dont les colonnes ont la même longueur mais les colonnes peuvent être de modes différents
V. Déroulement de l’enseignement
Organisation
Intervenants
• Franck Piller
• E-mail : franck.piller@univ-tours.fr
• Bureau B246 (bâtiment B)
• Julie Scholler
• Site :https://juliescholler.gitlab.io/
• E-mail : julie.scholler@univ-tours.fr
• Bureau B246 (bâtiment B)
Contacts pour les questions générales
• lecot2.zulipchat.com
Inscription avec l’adresse mail étudiante suite à un mail d’invitation
Commencer par lire les messages du sujet Utilisation de Zulip dans le canalGénéral sur la L2
Objectifs de l’enseignement
• Se familiariser avec le logiciel R
• Apprendre à utiliser les outils de gestion de données ainsi que les outils statistiques de base du logiciel R
Contenu des travaux pratiques
• Découverte du logiciel R : interface RStudio, manipulations et objets de base
• Études descriptives de données enregistrées dans un data frame
• Représentations graphiques
• Importation, exportation et manipulation de données
V. Déroulement de l’enseignement
Structure
• 2 séances de cours magistraux de 1h
• 5 séances de travaux pratiques de 2h
Support pédagogique en ligne
• notes de cours
• fascicule de travaux pratiques (corrigés partiels sur Celene)
• base de données
Modalités d’évaluation
• Session 1 : contrôle continu
• trois exercices à effectuer en dehors des heures de TP
• une épreuve sur poste informatique en fin de semestre
• Session 2 : examen sous forme d’un exercice sur ordinateur