MASTER 2 SIDE Pˆole Lamartine - ULCO STATISTIQUES ET INFORMATIQUE F´evrier 2011 - Session 1, Semestre 2
Dur´ee de l’´epreuve : 3h00 Tous documents autoris´es.
(Les trois exercices sont ind´ependants. Un soin tout particulier sera apport´e `a la r´edaction des r´eponses)
Exercice 1
Partie I. (5 points)
1. 0,5pt Importer sous R le fichier de donn´ees mis `a disposition dans le dossier≪Master SIDE/≫en utilisant la fonction ad´equate.
> Quetelet<-read.csv(file.choose())
2. 0,5pt + 0,5pt Afficher, une par une, les variablestaille,poids etsexe. Cr´eer 3 vecteurs taille, poids et sexe correspondant aux donn´ees de la table.
> Quetelet$taille
> Quetelet$poids
> Quetelet$sexe
> taille<-Quetelet$taille
> taille<-Quetelet$poids
> taille<-Quetelet$sexe
3. 0,5pt Quel est le nombre d’individus dans l’´echantillon ?
> length(Quetelet$taille)
4. 0,5pt + 0,5pt Afficher le tableau des indicateurs de tendance centrale pour les deux variables quantitatives. Essayer ´egalement cette commande en donnant le nom de la table et non le nom d’une variable. Qu’obtient-on ?
> summary(taille)
> summary(poids)
> summary(Quetelet$taille)
> summary(Quetelet$poids)
5. 1pt D´ecomposer l’´echantillon en un ´echantillon d’hommes et un ´echantillon de femmes.
> genre<-split(Quetelet,sexe)
6. 0,5pt + 0,5pt Quel est le nombre d’hommes et le nombre de femmes dans l’´echantillon ?
> nrow(genre$f)
> nrow(genre$h)
Partie II. (9 points)
La masse corporelle d’un individu est mesur´ee `a partir du poids et de la taille. L’indice le plus utilis´e est celui propos´e par Adolphe Qu´etelet (1796-1874), astronome et math´ematicien belge.
1/4
7. 1pt Construire la variable ≪indice de Qu´etelet≫`a partir des donn´ees imc = poids
taille2 .
La taille est exprim´ee en m`etre et le poids en kilogrammes. Cet indice s’appelle aujourd’hui≪in- dice de masse corporelle≫(imc) ou≪body mass index≫(bmi). Il permet de mesurer la corpulence de l’homme adulte. L’Organisation Mondiale de la Sant´e a d´efini les crit`eres suivants : maigreur (inf´erieur `a 18,5), normal (de 18,5 `a 25), risque de surpoids (de 25 `a 30), ob´esit´e (sup´erieur `a 30).
Mais l’indice de Qu´etelet n’a qu’une valeur indicative. Pour d´eterminer l’existence d’une ob´esit´e r´eelle, il faut faire d’autres mesures destin´ees `a ´etablir exactement la proportion de masse grasse, car c’est l’exc`es de masse grasse qui repr´esente un facteur de risque.
> imc<-poids/(taille/100)2
8. 0,5pt + 1,5pt Calculer les param`etres statistiques ´el´ementaires de cette nouvelle variable sur l’en- semble des individus et en fonction de chaque sexe.
> summary(imc)
> genreimc<-split(imc,sexe)
> lapply(genreimc,summary)
9. 1pt Construire l’histogramme de cette nouvelle variable sur l’ensemble des individus.
> hist(imc, col = grey(0.8))
10. 0,5pt + 1pt Comparer graphiquement les indices de masse corporelle chez les hommes et chez les femmes `a l’aide d’histogrammes et de fonctions de r´epartitions empiriques (utiliser la fonction
≪ecdf≫ de la librairie≪stepfun≫).
> par(mfcol = c(2, 2))
> hist(imc[sexe == "h"], main = "Hommes", xlab = "imc", xlim = c(16,27), col = grey(0.9))
> hist(imc[sexe == "f"], main = "Femmes", xlab = "imc", xlim = c(16,27), col = grey(0.9))
> plot(ecdf(imc[sexe == "h"]), main = "")
> plot(ecdf(imc[sexe == "f"]), main = "") Si on souhaite un passage `a la mod´elisation :
> par(mfcol = c(2, 2))
> hist(imch <- imc[sexe == "h"], main = "Hommes", xlab = "imc", xlim = c(16,27), col
= grey(0.9), prob = T)
> lines(x0 <- seq(16, 28, le = 50), dnorm(x0, mean(imch), sd(imch)),lwd = 2, col =
"red")
> hist(imcf <- imc[sexe == "f"], main = "Femmes", xlab = "imc", xlim = c(16,27), col
= grey(0.9), prob = T)
> lines(x1 <- seq(16, 26, le = 50), dnorm(x1, mean(imcf), sd(imcf)),lwd = 2, col =
"red")
> plot(ecdf(imch), main = "")
> lines(x0, pnorm(x0, mean(imch), sd(imch)), lwd = 2, col = "red")
> plot(ecdf(imc[sexe == "f"]), main = "")
> lines(x1, pnorm(x1, mean(imcf), sd(imcf)), lwd = 2, col = "red")
11. 1pt En utilisant la fonction≪boxplot≫, repr´esenter l’indice de Qu´etelet en fonction du sexe.
2/4
> boxplot(imc ∼ sexe, col = grey(0.8))
12. 0,5pt + 1pt Construire sur un seul graphique les nuages de points de l’indice de Qu´etelet en fonc- tion de la taille, en fonction du poids, pour chaque sexe. Commenter.
> par(mfcol = c(2, 2))
> plot(imc[sexe == "h"], tai[sexe == "h"], xlim = c(min(imc), max(imc)),ylim = c(min(tai), max(tai)), pch = 20, xlab = "imc", ylab = "taille",main = "hommes")
> plot(imc[sexe == "h"], poi[sexe == "h"], xlim = c(min(imc), max(imc)),ylim = c(min(poi), max(poi)), pch = 20, xlab = "imc", ylab = "poids")
> plot(imc[sexe == "f"], tai[sexe == "f"], xlim = c(min(imc), max(imc)),ylim = c(min(tai), max(tai)), pch = 20, xlab = "imc", ylab = "taille", main = "femmes")
> plot(imc[sexe == "f"], poi[sexe == "f"], xlim = c(min(imc), max(imc)),ylim = c(min(poi), max(poi)), pch = 20, xlab = "imc", ylab = "poids")
13. 1pt Repr´esenter, sur un seul graphique, le nuage de points de l’indice de Qu´etelet en sp´ecifiant hommes et femmes. Placer les bornes des crit`eres de l’O.M.S. Commenter.
> plot(imc, pch = 19, cex = 2, col = c("deeppink3", "blue")[unclass(sexe)])
> abline(h = 18.5)
> abline(h = 25)
> title("indice de masse corporelle")
> ll0 = c("femmes", "hommes")
> legend(1, 24.8, ll0, pch = 21, pt.cex = 2, cex = 1.25, col = c("deeppink3","blue"), pt.bg = c("deeppink3", "blue"))
Exercice 2 (2 points)
X suit une loi binomiale de param`etres (50,1/3). Calculer la probabilit´e des ´ev´enements suivants 1. 0,5pt {X= 1};
> dbinom(1,50,1/3)
2. 0,5pt {X≤5};
> pbinom(5,50,1/3)
3. 0,5pt {X≥15};
> 1-pbinom(15,50,1/3)
4. 0,5pt {X /∈ {15,3,4,10}}.
> 1-(dbinom(3,50,1/3)+dbinom(4,50,1/3)+dbinom(10,50,1/3)+dbinom(15,50,1/3))
Exercice 3 (6 points)
Soit X une variable al´eatoire qui suit une loi normale standardN(0,1).
1. 3×0,5pt Calculer la probabilit´e des ´ev´enements suivants : {X≤1};{X≥26};{0.5< X≤1}.
> pnorm(1)
> 1-pnorm(26)
3/4
> pnorm(1)-pnorm(0.5)
2. 0,5pt Calculer le quantile d’ordre a= 0.75, c’est-`a-dire la valeur dex telle que P(X≤x) =a.
> qnorm(0.75)
3. 1,5pt Repr´esenter graphiquement la densit´e et la fonction de r´epartition de la loi deX.
> par(mfrow = c(1, 2))
> w0 <- seq(-3, 3, length = 500)
> plot(w0, dnorm(w0), type = "l", main="fonction de densité")
> plot(w0, pnorm(w0), type = "l", main="fonction de répartition")
4. 0,5pt Simuler un ´echantillon (x1;. . .;x100) de taille n= 100 suivant la loi deX.
> ech<-rnorm(100)
5. 1pt Repr´esenter les valeurs de l’´echantillon simul´e.
> hist(ech, proba = T, nclass = 20, main = "Valeurs de l'échantillon", col = grey(0.8))
6. 1pt Cr´eer une liste qui contient la moyenne empirique 1 100
∑100 i=1
xi, le minimum de (x1, . . . , x100) et le maximum de (x1, . . . , x100).
> liste<-c(mean(ech),min(ech),max(ech))
4/4