Universit´e Joseph Fourier Fr´ed´erique Leblanc
L2/STA230 [email protected]
TP4 : Exercices R´ ecapitulatifs – Compte Rendu r´ edig´ e ` a rendre
Dans le premier exercice, montrez que vous savez repr´esenter graphiquement des donn´ees et les r´esumer num´eriquement par des choix pertinents, que vous savez aussi comparer, de fa¸con descriptive et empirique, deux sous-populations. Interpr´etez, commentez vos r´esultats et proposez des ”hypoth`eses”
plausibles concernant la population dont est issu l’´echantillon ´etudi´e. Dans le second, proposez une repr´esentation ad´equate pour illustrer le TCL sur un mod`ele de Bernoulli avec p choisi entre 0.1 et 0.2 et en effectuant N r´ealisations de X¯n (avec 50 ≤ N ≤100 et deux valeurs de n bien choisies) et permettant d’illustrer votre propos.
Exercice 1 : statistiques descriptives
Choisissez une variable parmi les variables quantitatives continues autre que la variable taille (data$ht) dans le fichier de donn´ees HER. Choisissez une des variables qualitatives parmi celles propos´ees qui vous servira de facteur (sexe, traitement,...) ou d´erivez en une des variables propos´ees (comme par exemple une variable classe d’ˆage avec la modalit´e ”jeune” pour les 10-25 ans ”ˆage moyen” pour les 25-65” et
”vieux” pour les plus de 65 ans).
1. Indiquez la variable que vous avez choisie et le facteur que vous utilisez.
2. Faites un r´esum´e num´erique de la variable ´etudi´ee.
• Ind´ependamment de la modalit´es du facteur.
• Pour chaque sous-´echantillon associ´e `a un mˆeme niveau du facteur (par ex. ´ech.fem.–´ech.hom.
si le facteur d’´etude choisi est le sexe.)
• Une phrase d’interpr´etation de vos r´esultats ou hypoth`ese concernant la population partielle- ment d´ecrite par l’´echantillon observ´e.
3. Faites un graphique permettant de d´ecrire la r´epartition observ´ee de la variable consid´er´ee ind´ependamment du facteur. Vous indiquerez dans votre r´eponse :
• la ligne principale de commande R que vous utilisez pour produire chaque graphique de la partition graphique que vous aurez choisie (1 ou plusieurs morceaux selon ce que vous choisissez de produire simultan´ement un ou plusieurs graphiques).
• Le graphique
• Un Commentaire ou une interpr´etation des graphiques.
Exercice 2 : Simulation et TCL
1. Choisir une valeur pour pcomprise entre 10% et 20% et l’affecter l`a `a p. Choisir deux valeurs de taille d’´echantillons n1 et n2 qui permettront d’illustrer deux situations diff´erentes o`u dans l’une l’approximation par une loi normale est correcte et dans l’autre est ne l’est pas (les affecter `a n1 et n2). Choisir aussi le nombre de simulationsN (entre 50 et 100 ) du n-´echantillon tir´e sous une Bernoulli de param`etrep.
2. Donner la ligne de commande permettant de simuler et ranger N r´ealisation de l’´echantillon de taillen=n1. Puis celle permettant de calculer la moyenne empirique de chacune desN simulations.
3. Produire et commenter deux graphiques (un pour chacune des deux valeursn1et n2 choisies).
1