Solutionnaire au devoir 3

(1)

Solutionnaire au devoir 3

14 devoirs

notes sur 25 0510152025 10152025

FIG. 1. Les r´esultats du devoir 3.

(1) [2 points] On dispose d’une population de femmes de 25 ans. On peut supposer que leurs poids sont distribués suivant une loi normale de moyenneµ= 58kg et l’écart- typeσ = 4 kg. On tire un échantillon de 35 femmes. Déterminez un invervalle de pari pour le poids moyen de l’échantillon au niveau de confiance95%.

⊳Car la taillenest suffisamment grande, on a Z = X−µ

σ/√

n ∼N(0,1)approximativement, d’o`u on d´eduit, comme dans le cours,

0.95 = P(µ−i < X < µ+i)

= P

−i 4/√

35 < Z < i 4/√

35

,

On a a = ₄_/^√ⁱ₃₅ = 1.96, et par cons´equent la valeur d’incertitude i = 1.3252.

L’intervalle de pari :[56.6,59.3]. ⊲

(2)

(2) [4 points] Sur un échantillon de100patients sur lesquels a été pratiquée une opération chirurgicale donnée,18ont présenté ultérieurement des effets secondaires graves dus

`a cette op´eration.

(a) Calculez un intervalle de confiance au risqueα = 5%du pourcentage d’effets secondaires dus `a l’intervention chirurgicale.

(b) On souhaite estimer le pourcentage d’effets secondaires avec une précisioni = 5%au même risque deα= 5%. Quelle devra être la taille de l’échantillon ?

⊳

(a) L’intervalle de confiance au niveau95%est ´egal `a ˆ

p±a

rp(1−p) n−1 = 18

99±1.96

r.18(1−.18)

99 = [0.106,0.258].

(b) On r´esolve

n≥ a

i ²

(0.18(1−0.18)) = 226.81, pour en conclure :n=227 observations.

⊲ (3) Soit un échantillon aléatoire de10femmes ayant les taux de cholestérol suivants (en

grammes par litre) :

X 3.0 1.8 2.1 2.7 1.4 1.9 2.2 2.5 1.7 2.0 (a) [1 point] Calculez la moyenne d’´echantillon.

(b) [2 points] Calculez l’écart-type de la variable aléatoireX sur l’espace fondamental den= 10 éléments.

(c) [1 point] Calculez l’´ecart-type d’´echantillon.

(d) [2 points] Calculez les intervalles de confiance à 95% et à 99% pour le taux moyen de cholestérol de la population des femmes d’où a été tiré l’échantillon.

⊳

(a) Voici la moyenne d’´echantillon :

x=X

xi/n = 2.13.

> x=c(3,1.8,2.1,2.7,1.4,1.9,2.2,2.5,1.7,2)

> mean(x)

(b) L’´ecart-type de la variable al´eatoire X sur l’espace fondamental de n = 10

´el´ements : σ=

r P(xi−x)²

n =

r(P

x²_i)−(P xi)²/n n

= 0.4605432.

(3)

> sqrt((sum(xˆ2)-(sum(x)ˆ2)/10)/10) [1] 0.4605432

(c) L’´ecart-type d’´echantillon : s=

r P(xi−x)²

n−1 =

s (P

x²_i)−(P

xi)²/n n−1

= 0.4854551.

> sd(x)

[1] 0.4854551

Remarque : la seule diff´erence entre (b) et (c), c’est le d´enominateur (n = 10 contren−1 = 9).

(d) L’intervalle de confiance à95% pour le taux moyen de cholestérol et obtenu en utilisant la loi de Student avec9degrés de liberté :

x±t⁹_.025

√s

n = 2.13±(2.262)

0.485455

√10

= [1.78,2.48].

(e) De mˆeme, `a99%: x±t⁹_.005

√s

n = 2.13±(3.250)

0.485455

√10

= [1.63,2.63].

⊲ (4) [7 points] Dix-huit mesures de la concentration de polluant ozone ont ´et´e prises

pendant l’ann´ee derni`ere.

5.4 4.2 5.1 5.7 4.5 4.2 3.3 5.8 5.1 4.7 4.5 4.8 5.9 6.0 4.0 3.8 5.6 4.5

(a) La concentration d’ozone semble-t-elle suivre la loi normale ? (Sugg´estion : uti- lisez le test de comparaison quantile-quantile).

(b) Utilisez R pour obtenir un sommaire de cette variable numérique, y compris la moyenne, l’écart-type, le minimum, le maximum, la médiane, les quartiles, et la taille d’échantillon simultanement.

(c) En utilisant la statistique descriptive de la partie (4b), donnez un estimateur de la concentration moyenne d’ozone et l’´ecart-type de la moyenne d’´echantillon.

(d) Calculez un intervalle de confiance pour la concentation moyenne d’ozone au niveau de confiance95%.

(e) Les chercheurs supposaient qu’il y avait une réduction du contenu d’ozone. Afin de tester l’hypothèse nulleH⁰ :µ= 5.3contre l’hypothèse alternativeH_A :µ <

5.3, calculez la valeur de la statistique du test et la valeurpcorr´espondante.

(4)

(f) En vue de (4e), quelles sont vos conclusions auα = 5%? (g) De mˆeme, auα= 1%?

⊳

(a) > x=c(5.4, 4.2, 5.1, 5.7, 4.5, 4.2, + 3.3 , 5.8 , 5.1, 4.7, 4.5 , 4.8, + 5.9, 6.0, 4.0 ,3.8, 5.6, 4.5)

> x

[1] 5.4 4.2 5.1 5.7 4.5 4.2 3.3 5.8 5.1 4.7 4.5 + 4.8 5.9 6.0 4.0 3.8 5.6 4.5

> o <- as.data.frame(x)

> library(Rcmdr)

Choisir en R commander data→active data set→ choose active dataset. En- suite, on produit le Q-Q graphe :

−2 −1 0 1 2

3.54.04.55.05.56.0

norm quantiles

o$x

FIG. 2

Le graphe est consistent avec la normalit´e de la distribution. C’est curieux, puisque l’histogramme des valeurs de concentration ne semble pas du tout suivre la loi normale ! (voir la figure 3).

(b) Voici le sommaire de la variable num´erique d’ozone :

mean sd 0% 25% 50% 75% 100% n 4.838889 0.7860092 3.3 4.275 4.75 5.55 6 18

(5)

concentration d’ozone

fréquence

3.0 3.5 4.0 4.5 5.0 5.5 6.0

012345

FIG. 3. L’histogramme de la concentration d’ozone.

(c) L’estimation ponctuelle de la concentration d’ozone moyenne est la moyenne d’échantillon,x= 4.838889, dont l’erreur standard (l’écart type de la moyenne d’échantillon) est égale à

SE_x =sM =

√s

√n = 0.7860092

√18 = 0.18526.

(d) Voici un petit secret : l’intervalle de confiance peut ˆetre obtenu directement avec R commander.

Statistics→means→single-samplet-test, et ensuite mettrez les valeurs : Null hypothesis : mu = 4.838889, confidence level : .95, alternative hypothesis : population mean != mu0.

> t.test(o$x, alternative=’two.sided’, mu=4.838889, + conf.level=.95)

One Sample t-test data: o$x

t = 0, df = 17, p-value = 1

alternative hypothesis: true mean is not equal to 4.838889 95 percent confidence interval:

4.448016 5.229762

(6)

sample estimates:

mean of x 4.838889

Alors, l’intervalle de confiance au95%est[4.448016,5.229762].

Fac¸on alternative d’obtenir l’intervalle : x±t¹⁷_.025

√s

n = 4.838889±2.110 (0.18526) = [4.45,5.23].

(e) Utilisons R commander une fois de plus, avec l’hypothèse nulle µ = 5.3 et l’hypothèse alternativeµ < 5.3. Car on utilise la loi de Student, la valeur de la statistique du test est notée d’habitudet⁰ plutôt quez⁰.

> t.test(o$x, alternative=’less’, mu=5.3, conf.level=.95) One Sample t-test

data: o$x

t = -2.4889, df = 17, p-value = 0.01174

alternative hypothesis: true mean is less than 5.3 95 percent confidence interval:

-Inf 5.161176 sample estimates:

mean of x 4.838889

R commander nous donne comme la valeur t⁰ = −2.4889et comme la valeur p= 0.01174.

La fac¸on alternative : la statistique du test est t⁰ = x−5.3

s/√

n = 4.83888−5.3 0.7860092/√

18 =−2.4889.

La valeurpest égale àp=P(T <−2.4889) =P(T >2.4889), où T = X¯ −µ⁰

s/√ n

suit la loitde Student avecdf =n−1 = 17degr´es de libert´e. On a0.01< P <

0.025.

CeT n’est que la même variable aléatoire que nous notons d’habitudeZ, sauf que la lettreT est parfois utilisée afin de souligner queT suit la loi de Student centrée réduite,

T ∼tⁿ⁻¹, plutˆot que la loi normale.

(7)

(f) Au α = 5%, nous avons une forte évidence que la moyenne de population est inférieure à 5.3. L’hypothèse nulle serait rejetée.

(g) Pourtant, auα= 1%, on échoue à rejeter l’hypothèse nulle, puisque la valeurp est trop grande :

p= 0.01174>0.01 =α.

Donc, auα= 1%,nous ne pouvons pas conclure que la concentration moyenne d’ozone est inf´erieure `a 5.3.

⊲ (5) [3 points] Considerez l’´echantillon suivant.

3, 12, 4, 10, 9

(a) En utilisant la calculatrice, calculez la moyenne d’échantillon et l’écart-type d’échantillon.

(b) Supposons qu’il s’agit d’une étude préliminaire. Calculez la taille d’échantillon nécessaire pour être sûr au niveau de confiance 95% que l’incertitude absolue d’estimation de la moyenne ne dépasse pas3.75unités.

⊳

(a) Voici la moyenne d’´echantillon x=

Pxi

n = 38 5 = 7.6 et l’´ecart-type d’´echantillon :

s =

r P(xi−x)² n−1

= s

(P

x²_i)−(P x_i)²/n n−1

=

r350−(38)²/5

4 = 3.9115.

(b) Nous allons utilisers de (a) comme notre meuilleure approximation de σ. On obtient :

n≥ aσ

i ²

=z.025σ i

²

=

(1.96)(3.9115) 3.75

²

= 4.17961.

On a besoin den= 5observations.

⊲

(8)

(6) [3 points] Soixante femelles saines de moutons Souffolk agées3ans ont été injectées d’antibiothique Gentamicin, au dosage de10mg/kg. Avec R commander, on a produit le sommaire numérique suivant de la concentration sérique en Gentamicin dans leur sang 1.5 heures après l’injection.

mean sd 0% 25% 50% 75% 100% n

28.57 5.121848 11.9 25.775 28.65 32.5 41.2 60

Construisez un intervalle de confiance `a95%pour la moyenne de la population.

⊳ La taille d’échantillon est grande. Au 95%, l’intervalle de confiance pour la moyenne de la population est égal à

x±a s

√n = 28.57±1.96

5.12184

√60

= [27.27,29.87].

⊲