Solutionnaire au devoir 3
14 devoirs
notes sur 25 0510152025 10152025
FIG. 1. Les r´esultats du devoir 3.
(1) [2 points] On dispose d’une population de femmes de 25 ans. On peut supposer que leurs poids sont distribu´es suivant une loi normale de moyenneµ= 58kg et l’´ecart- typeσ = 4 kg. On tire un ´echantillon de 35 femmes. D´eterminez un invervalle de pari pour le poids moyen de l’´echantillon au niveau de confiance95%.
⊳Car la taillenest suffisamment grande, on a Z = X−µ
σ/√
n ∼N(0,1)approximativement, d’o`u on d´eduit, comme dans le cours,
0.95 = P(µ−i < X < µ+i)
= P
−i 4/√
35 < Z < i 4/√
35
,
On a a = 4/√i35 = 1.96, et par cons´equent la valeur d’incertitude i = 1.3252.
L’intervalle de pari :[56.6,59.3]. ⊲
(2) [4 points] Sur un ´echantillon de100patients sur lesquels a ´et´e pratiqu´ee une op´eration chirurgicale donn´ee,18ont pr´esent´e ult´erieurement des effets secondaires graves dus
`a cette op´eration.
(a) Calculez un intervalle de confiance au risqueα = 5%du pourcentage d’effets secondaires dus `a l’intervention chirurgicale.
(b) On souhaite estimer le pourcentage d’effets secondaires avec une pr´ecisioni = 5%au mˆeme risque deα= 5%. Quelle devra ˆetre la taille de l’´echantillon ?
⊳
(a) L’intervalle de confiance au niveau95%est ´egal `a ˆ
p±a
rp(1−p) n−1 = 18
99±1.96
r.18(1−.18)
99 = [0.106,0.258].
(b) On r´esolve
n≥ a
i 2
(0.18(1−0.18)) = 226.81, pour en conclure :n=227 observations.
⊲ (3) Soit un ´echantillon al´eatoire de10femmes ayant les taux de cholest´erol suivants (en
grammes par litre) :
X 3.0 1.8 2.1 2.7 1.4 1.9 2.2 2.5 1.7 2.0 (a) [1 point] Calculez la moyenne d’´echantillon.
(b) [2 points] Calculez l’´ecart-type de la variable al´eatoireX sur l’espace fonda- mental den= 10 ´el´ements.
(c) [1 point] Calculez l’´ecart-type d’´echantillon.
(d) [2 points] Calculez les intervalles de confiance `a 95% et `a 99% pour le taux moyen de cholest´erol de la population des femmes d’o`u a ´et´e tir´e l’´echantillon.
⊳
(a) Voici la moyenne d’´echantillon :
x=X
xi/n = 2.13.
> x=c(3,1.8,2.1,2.7,1.4,1.9,2.2,2.5,1.7,2)
> mean(x)
(b) L’´ecart-type de la variable al´eatoire X sur l’espace fondamental de n = 10
´el´ements : σ=
r P(xi−x)2
n =
r(P
x2i)−(P xi)2/n n
= 0.4605432.
> sqrt((sum(xˆ2)-(sum(x)ˆ2)/10)/10) [1] 0.4605432
(c) L’´ecart-type d’´echantillon : s=
r P(xi−x)2
n−1 =
s (P
x2i)−(P
xi)2/n n−1
= 0.4854551.
> sd(x)
[1] 0.4854551
Remarque : la seule diff´erence entre (b) et (c), c’est le d´enominateur (n = 10 contren−1 = 9).
(d) L’intervalle de confiance `a95% pour le taux moyen de cholest´erol et obtenu en utilisant la loi de Student avec9degr´es de libert´e :
x±t9.025
√s
n = 2.13±(2.262)
0.485455
√10
= [1.78,2.48].
(e) De mˆeme, `a99%: x±t9.005
√s
n = 2.13±(3.250)
0.485455
√10
= [1.63,2.63].
⊲ (4) [7 points] Dix-huit mesures de la concentration de polluant ozone ont ´et´e prises
pendant l’ann´ee derni`ere.
5.4 4.2 5.1 5.7 4.5 4.2 3.3 5.8 5.1 4.7 4.5 4.8 5.9 6.0 4.0 3.8 5.6 4.5
(a) La concentration d’ozone semble-t-elle suivre la loi normale ? (Sugg´estion : uti- lisez le test de comparaison quantile-quantile).
(b) Utilisez R pour obtenir un sommaire de cette variable num´erique, y compris la moyenne, l’´ecart-type, le minimum, le maximum, la m´ediane, les quartiles, et la taille d’´echantillon simultanement.
(c) En utilisant la statistique descriptive de la partie (4b), donnez un estimateur de la concentration moyenne d’ozone et l’´ecart-type de la moyenne d’´echantillon.
(d) Calculez un intervalle de confiance pour la concentation moyenne d’ozone au niveau de confiance95%.
(e) Les chercheurs supposaient qu’il y avait une r´eduction du contenu d’ozone. Afin de tester l’hypoth`ese nulleH0 :µ= 5.3contre l’hypoth`ese alternativeHA :µ <
5.3, calculez la valeur de la statistique du test et la valeurpcorr´espondante.
(f) En vue de (4e), quelles sont vos conclusions auα = 5%? (g) De mˆeme, auα= 1%?
⊳
(a) > x=c(5.4, 4.2, 5.1, 5.7, 4.5, 4.2, + 3.3 , 5.8 , 5.1, 4.7, 4.5 , 4.8, + 5.9, 6.0, 4.0 ,3.8, 5.6, 4.5)
> x
[1] 5.4 4.2 5.1 5.7 4.5 4.2 3.3 5.8 5.1 4.7 4.5 + 4.8 5.9 6.0 4.0 3.8 5.6 4.5
> o <- as.data.frame(x)
> library(Rcmdr)
Choisir en R commander data→active data set→ choose active dataset. En- suite, on produit le Q-Q graphe :
−2 −1 0 1 2
3.54.04.55.05.56.0
norm quantiles
o$x
FIG. 2
Le graphe est consistent avec la normalit´e de la distribution. C’est curieux, puisque l’histogramme des valeurs de concentration ne semble pas du tout suivre la loi normale ! (voir la figure 3).
(b) Voici le sommaire de la variable num´erique d’ozone :
mean sd 0% 25% 50% 75% 100% n 4.838889 0.7860092 3.3 4.275 4.75 5.55 6 18
concentration d’ozone
fréquence
3.0 3.5 4.0 4.5 5.0 5.5 6.0
012345
FIG. 3. L’histogramme de la concentration d’ozone.
(c) L’estimation ponctuelle de la concentration d’ozone moyenne est la moyenne d’´echantillon,x= 4.838889, dont l’erreur standard (l’´ecart type de la moyenne d’´echantillon) est ´egale `a
SEx =sM =
√s
√n = 0.7860092
√18 = 0.18526.
(d) Voici un petit secret : l’intervalle de confiance peut ˆetre obtenu directement avec R commander.
Statistics→means→single-samplet-test, et ensuite mettrez les valeurs : Null hypothesis : mu = 4.838889, confidence level : .95, alternative hypothesis : population mean != mu0.
> t.test(o$x, alternative=’two.sided’, mu=4.838889, + conf.level=.95)
One Sample t-test data: o$x
t = 0, df = 17, p-value = 1
alternative hypothesis: true mean is not equal to 4.838889 95 percent confidence interval:
4.448016 5.229762
sample estimates:
mean of x 4.838889
Alors, l’intervalle de confiance au95%est[4.448016,5.229762].
Fac¸on alternative d’obtenir l’intervalle : x±t17.025
√s
n = 4.838889±2.110 (0.18526) = [4.45,5.23].
(e) Utilisons R commander une fois de plus, avec l’hypoth`ese nulle µ = 5.3 et l’hypoth`ese alternativeµ < 5.3. Car on utilise la loi de Student, la valeur de la statistique du test est not´ee d’habitudet0 plutˆot quez0.
> t.test(o$x, alternative=’less’, mu=5.3, conf.level=.95) One Sample t-test
data: o$x
t = -2.4889, df = 17, p-value = 0.01174
alternative hypothesis: true mean is less than 5.3 95 percent confidence interval:
-Inf 5.161176 sample estimates:
mean of x 4.838889
R commander nous donne comme la valeur t0 = −2.4889et comme la valeur p= 0.01174.
La fac¸on alternative : la statistique du test est t0 = x−5.3
s/√
n = 4.83888−5.3 0.7860092/√
18 =−2.4889.
La valeurpest ´egale `ap=P(T <−2.4889) =P(T >2.4889), o`u T = X¯ −µ0
s/√ n
suit la loitde Student avecdf =n−1 = 17degr´es de libert´e. On a0.01< P <
0.025.
CeT n’est que la mˆeme variable al´eatoire que nous notons d’habitudeZ, sauf que la lettreT est parfois utilis´ee afin de souligner queT suit la loi de Student centr´ee r´eduite,
T ∼tn−1, plutˆot que la loi normale.
(f) Au α = 5%, nous avons une forte ´evidence que la moyenne de population est inf´erieure `a 5.3. L’hypoth`ese nulle serait rejet´ee.
(g) Pourtant, auα= 1%, on ´echoue `a rejeter l’hypoth`ese nulle, puisque la valeurp est trop grande :
p= 0.01174>0.01 =α.
Donc, auα= 1%,nous ne pouvons pas conclure que la concentration moyenne d’ozone est inf´erieure `a 5.3.
⊲ (5) [3 points] Considerez l’´echantillon suivant.
3, 12, 4, 10, 9
(a) En utilisant la calculatrice, calculez la moyenne d’´echantillon et l’´ecart-type d’´echantillon.
(b) Supposons qu’il s’agit d’une ´etude pr´eliminaire. Calculez la taille d’´echantillon n´ecessaire pour ˆetre sˆur au niveau de confiance 95% que l’incertitude absolue d’estimation de la moyenne ne d´epasse pas3.75unit´es.
⊳
(a) Voici la moyenne d’´echantillon x=
Pxi
n = 38 5 = 7.6 et l’´ecart-type d’´echantillon :
s =
r P(xi−x)2 n−1
= s
(P
x2i)−(P xi)2/n n−1
=
r350−(38)2/5
4 = 3.9115.
(b) Nous allons utilisers de (a) comme notre meuilleure approximation de σ. On obtient :
n≥ aσ
i 2
=z.025σ i
2
=
(1.96)(3.9115) 3.75
2
= 4.17961.
On a besoin den= 5observations.
⊲
(6) [3 points] Soixante femelles saines de moutons Souffolk ag´ees3ans ont ´et´e inject´ees d’antibiothique Gentamicin, au dosage de10mg/kg. Avec R commander, on a produit le sommaire num´erique suivant de la concentration s´erique en Gentamicin dans leur sang 1.5 heures apr`es l’injection.
mean sd 0% 25% 50% 75% 100% n
28.57 5.121848 11.9 25.775 28.65 32.5 41.2 60
Construisez un intervalle de confiance `a95%pour la moyenne de la population.
⊳ La taille d’´echantillon est grande. Au 95%, l’intervalle de confiance pour la moyenne de la population est ´egal `a
x±a s
√n = 28.57±1.96
5.12184
√60
= [27.27,29.87].
⊲