TD3
1. Importation et exportation de données
a. Créer un fichier ASCII (fichier texte, séparateurs tabulations) avec 4 colonnes (3 numériques et une caractère) et 5 observations, en précisant dans une première ligne le nom attribué à chaque colonne. Sauvegarder dans le répertoire de travail.
b. Importer le fichier dans R, dans un objet de type data.frame. Afficher le contenu de l’objet, vérifier le nom des lignes et des colonnes (name(), dimname(),
colname(), rawname()) c. Donner des noms aux lignes
d. Ajouter une colonne dont les valeurs sont l’indicatrice sur les valeurs supérieures à dix de la troisième colonne (1 si elle est >10, 0 sinon).
e. Exporter le nouveau data.frame vers le répertoire de travail sous forme texte, séparateur espace sans y écrire le nom des lignes et des colonnes.
2. Lois de probabilités
a. Calculer la probabilité qu'une variable aléatoire X suivant une loi binomiale de paramètres n=10 et p=1/3 soit égale à 0,1,2,…10.
b. Calculer la probabilité qu'une variable aléatoire X suivant une loi B(10,1/3) soit inférieure ou égale à 10 et supérieure à 5.
c. Calculer la valeur de x pour laquelle P(X<=x)=0.97, où X suit une loi normale centrée réduite.
d. Calculer le quantile à 2% d’une loi de Student à 5 ddl.
3. Statistiques descriptives
Charger le jeu de données « mtcars » du package base, et regarder ce qu'il contient.
a. Pour les caractéristiques continues, on peut obtenir un résumé statistique en calculant les estimations empiriques standard : la moyenne, la variance, les premiers et troisièmes quantiles ainsi que la médiane. Calculer ces grandeurs sur les colonnes de « mtcars » correspondant à des variables continues (summary()).
Tracer les histogrammes et les boxplots correspondants (hist(), boxplot()).
Commentez.
b. Quelles sont les variables pour lesquelles l’hypothèse de normalité est plausible (qqnorm(), qqline())?
c. Etudier les éventuelles corrélations existant entre ces caractéristiques (cor()) d. Pour les caractéristiques discrètes, donner la table des fréquences (table()) et
une représentation graphique de cette table (barplot(table()). Commenter.
4. Génération d’échantillons aléatoires, loi de la moyenne et de la variance empirique
a. Générer 100 échantillons de taille 100 issus d’une loi normale de moyenne 3 et de variance 1. Pour chaque échantillon, calculer la moyenne et la variance empirique (apply(), replicate()).
b. Calculer la moyenne et la variance des deux séries.
c. Tracer sur le même graphe l’histogramme en fréquences relatives, un estimateur à noyau de la série des moyennes.
d. Recommencer pour 100, 500, 1000 échantillons de taille 100, 1000. Que constatez-vous ?
e. Commentez. Les résultats obtenus.
5. Tirages aléatoires
f. Simuler 25 lancers d’une pièce de monnaie.
g. Etudier les procédures suivantes :
- urn=c(rep(« red »,8),rep(« blue »,4),rep(« yellow »,3)) ; sample(urn,6,replace=FALSE)
-
plot(0:10,dbinom(0:10,size=10,prob=.25),type="h",lwd=30,col="gray",main="loi binomiale n=10 p=0.25")
- curve(dnorm(x),from=-3, to=3).
- curve(pnorm(x,mean=10,sd=2),from=4,to=16)