• Aucun résultat trouvé

Solutionnaire au devoir 3

N/A
N/A
Protected

Academic year: 2022

Partager "Solutionnaire au devoir 3"

Copied!
8
0
0

Texte intégral

(1)

Solutionnaire au devoir 3

14 devoirs

notes sur 25 0510152025 10152025

FIG. 1. Les r´esultats du devoir 3.

(1) [2 points] On dispose d’une population de femmes de 25 ans. On peut supposer que leurs poids sont distribu´es suivant une loi normale de moyenneµ= 58kg et l’´ecart- typeσ = 4 kg. On tire un ´echantillon de 35 femmes. D´eterminez un invervalle de pari pour le poids moyen de l’´echantillon au niveau de confiance95%.

⊳Car la taillenest suffisamment grande, on a Z = X−µ

σ/√

n ∼N(0,1)approximativement, d’o`u on d´eduit, comme dans le cours,

0.95 = P(µ−i < X < µ+i)

= P

−i 4/√

35 < Z < i 4/√

35

,

On a a = 4/i35 = 1.96, et par cons´equent la valeur d’incertitude i = 1.3252.

L’intervalle de pari :[56.6,59.3]. ⊲

(2)

(2) [4 points] Sur un ´echantillon de100patients sur lesquels a ´et´e pratiqu´ee une op´eration chirurgicale donn´ee,18ont pr´esent´e ult´erieurement des effets secondaires graves dus

`a cette op´eration.

(a) Calculez un intervalle de confiance au risqueα = 5%du pourcentage d’effets secondaires dus `a l’intervention chirurgicale.

(b) On souhaite estimer le pourcentage d’effets secondaires avec une pr´ecisioni = 5%au mˆeme risque deα= 5%. Quelle devra ˆetre la taille de l’´echantillon ?

(a) L’intervalle de confiance au niveau95%est ´egal `a ˆ

p±a

rp(1−p) n−1 = 18

99±1.96

r.18(1−.18)

99 = [0.106,0.258].

(b) On r´esolve

n≥ a

i 2

(0.18(1−0.18)) = 226.81, pour en conclure :n=227 observations.

⊲ (3) Soit un ´echantillon al´eatoire de10femmes ayant les taux de cholest´erol suivants (en

grammes par litre) :

X 3.0 1.8 2.1 2.7 1.4 1.9 2.2 2.5 1.7 2.0 (a) [1 point] Calculez la moyenne d’´echantillon.

(b) [2 points] Calculez l’´ecart-type de la variable al´eatoireX sur l’espace fonda- mental den= 10 ´el´ements.

(c) [1 point] Calculez l’´ecart-type d’´echantillon.

(d) [2 points] Calculez les intervalles de confiance `a 95% et `a 99% pour le taux moyen de cholest´erol de la population des femmes d’o`u a ´et´e tir´e l’´echantillon.

(a) Voici la moyenne d’´echantillon :

x=X

xi/n = 2.13.

> x=c(3,1.8,2.1,2.7,1.4,1.9,2.2,2.5,1.7,2)

> mean(x)

(b) L’´ecart-type de la variable al´eatoire X sur l’espace fondamental de n = 10

´el´ements : σ=

r P(xi−x)2

n =

r(P

x2i)−(P xi)2/n n

= 0.4605432.

(3)

> sqrt((sum(xˆ2)-(sum(x)ˆ2)/10)/10) [1] 0.4605432

(c) L’´ecart-type d’´echantillon : s=

r P(xi−x)2

n−1 =

s (P

x2i)−(P

xi)2/n n−1

= 0.4854551.

> sd(x)

[1] 0.4854551

Remarque : la seule diff´erence entre (b) et (c), c’est le d´enominateur (n = 10 contren−1 = 9).

(d) L’intervalle de confiance `a95% pour le taux moyen de cholest´erol et obtenu en utilisant la loi de Student avec9degr´es de libert´e :

x±t9.025

√s

n = 2.13±(2.262)

0.485455

√10

= [1.78,2.48].

(e) De mˆeme, `a99%: x±t9.005

√s

n = 2.13±(3.250)

0.485455

√10

= [1.63,2.63].

(4) [7 points] Dix-huit mesures de la concentration de polluant ozone ont ´et´e prises

pendant l’ann´ee derni`ere.

5.4 4.2 5.1 5.7 4.5 4.2 3.3 5.8 5.1 4.7 4.5 4.8 5.9 6.0 4.0 3.8 5.6 4.5

(a) La concentration d’ozone semble-t-elle suivre la loi normale ? (Sugg´estion : uti- lisez le test de comparaison quantile-quantile).

(b) Utilisez R pour obtenir un sommaire de cette variable num´erique, y compris la moyenne, l’´ecart-type, le minimum, le maximum, la m´ediane, les quartiles, et la taille d’´echantillon simultanement.

(c) En utilisant la statistique descriptive de la partie (4b), donnez un estimateur de la concentration moyenne d’ozone et l’´ecart-type de la moyenne d’´echantillon.

(d) Calculez un intervalle de confiance pour la concentation moyenne d’ozone au niveau de confiance95%.

(e) Les chercheurs supposaient qu’il y avait une r´eduction du contenu d’ozone. Afin de tester l’hypoth`ese nulleH0 :µ= 5.3contre l’hypoth`ese alternativeHA :µ <

5.3, calculez la valeur de la statistique du test et la valeurpcorr´espondante.

(4)

(f) En vue de (4e), quelles sont vos conclusions auα = 5%? (g) De mˆeme, auα= 1%?

(a) > x=c(5.4, 4.2, 5.1, 5.7, 4.5, 4.2, + 3.3 , 5.8 , 5.1, 4.7, 4.5 , 4.8, + 5.9, 6.0, 4.0 ,3.8, 5.6, 4.5)

> x

[1] 5.4 4.2 5.1 5.7 4.5 4.2 3.3 5.8 5.1 4.7 4.5 + 4.8 5.9 6.0 4.0 3.8 5.6 4.5

> o <- as.data.frame(x)

> library(Rcmdr)

Choisir en R commander dataactive data setchoose active dataset. En- suite, on produit le Q-Q graphe :

−2 −1 0 1 2

3.54.04.55.05.56.0

norm quantiles

o$x

FIG. 2

Le graphe est consistent avec la normalit´e de la distribution. C’est curieux, puisque l’histogramme des valeurs de concentration ne semble pas du tout suivre la loi normale ! (voir la figure 3).

(b) Voici le sommaire de la variable num´erique d’ozone :

mean sd 0% 25% 50% 75% 100% n 4.838889 0.7860092 3.3 4.275 4.75 5.55 6 18

(5)

concentration d’ozone

fréquence

3.0 3.5 4.0 4.5 5.0 5.5 6.0

012345

FIG. 3. L’histogramme de la concentration d’ozone.

(c) L’estimation ponctuelle de la concentration d’ozone moyenne est la moyenne d’´echantillon,x= 4.838889, dont l’erreur standard (l’´ecart type de la moyenne d’´echantillon) est ´egale `a

SEx =sM =

√s

√n = 0.7860092

√18 = 0.18526.

(d) Voici un petit secret : l’intervalle de confiance peut ˆetre obtenu directement avec R commander.

Statisticsmeanssingle-samplet-test, et ensuite mettrez les valeurs : Null hypothesis : mu = 4.838889, confidence level : .95, alternative hypothesis : population mean != mu0.

> t.test(o$x, alternative=’two.sided’, mu=4.838889, + conf.level=.95)

One Sample t-test data: o$x

t = 0, df = 17, p-value = 1

alternative hypothesis: true mean is not equal to 4.838889 95 percent confidence interval:

4.448016 5.229762

(6)

sample estimates:

mean of x 4.838889

Alors, l’intervalle de confiance au95%est[4.448016,5.229762].

Fac¸on alternative d’obtenir l’intervalle : x±t17.025

√s

n = 4.838889±2.110 (0.18526) = [4.45,5.23].

(e) Utilisons R commander une fois de plus, avec l’hypoth`ese nulle µ = 5.3 et l’hypoth`ese alternativeµ < 5.3. Car on utilise la loi de Student, la valeur de la statistique du test est not´ee d’habitudet0 plutˆot quez0.

> t.test(o$x, alternative=’less’, mu=5.3, conf.level=.95) One Sample t-test

data: o$x

t = -2.4889, df = 17, p-value = 0.01174

alternative hypothesis: true mean is less than 5.3 95 percent confidence interval:

-Inf 5.161176 sample estimates:

mean of x 4.838889

R commander nous donne comme la valeur t0 = −2.4889et comme la valeur p= 0.01174.

La fac¸on alternative : la statistique du test est t0 = x−5.3

s/√

n = 4.83888−5.3 0.7860092/√

18 =−2.4889.

La valeurpest ´egale `ap=P(T <−2.4889) =P(T >2.4889), o`u T = X¯ −µ0

s/√ n

suit la loitde Student avecdf =n−1 = 17degr´es de libert´e. On a0.01< P <

0.025.

CeT n’est que la mˆeme variable al´eatoire que nous notons d’habitudeZ, sauf que la lettreT est parfois utilis´ee afin de souligner queT suit la loi de Student centr´ee r´eduite,

T ∼tn1, plutˆot que la loi normale.

(7)

(f) Au α = 5%, nous avons une forte ´evidence que la moyenne de population est inf´erieure `a 5.3. L’hypoth`ese nulle serait rejet´ee.

(g) Pourtant, auα= 1%, on ´echoue `a rejeter l’hypoth`ese nulle, puisque la valeurp est trop grande :

p= 0.01174>0.01 =α.

Donc, auα= 1%,nous ne pouvons pas conclure que la concentration moyenne d’ozone est inf´erieure `a 5.3.

(5) [3 points] Considerez l’´echantillon suivant.

3, 12, 4, 10, 9

(a) En utilisant la calculatrice, calculez la moyenne d’´echantillon et l’´ecart-type d’´echantillon.

(b) Supposons qu’il s’agit d’une ´etude pr´eliminaire. Calculez la taille d’´echantillon n´ecessaire pour ˆetre sˆur au niveau de confiance 95% que l’incertitude absolue d’estimation de la moyenne ne d´epasse pas3.75unit´es.

(a) Voici la moyenne d’´echantillon x=

Pxi

n = 38 5 = 7.6 et l’´ecart-type d’´echantillon :

s =

r P(xi−x)2 n−1

= s

(P

x2i)−(P xi)2/n n−1

=

r350−(38)2/5

4 = 3.9115.

(b) Nous allons utilisers de (a) comme notre meuilleure approximation de σ. On obtient :

n≥ aσ

i 2

=z.025σ i

2

=

(1.96)(3.9115) 3.75

2

= 4.17961.

On a besoin den= 5observations.

(8)

(6) [3 points] Soixante femelles saines de moutons Souffolk ag´ees3ans ont ´et´e inject´ees d’antibiothique Gentamicin, au dosage de10mg/kg. Avec R commander, on a produit le sommaire num´erique suivant de la concentration s´erique en Gentamicin dans leur sang 1.5 heures apr`es l’injection.

mean sd 0% 25% 50% 75% 100% n

28.57 5.121848 11.9 25.775 28.65 32.5 41.2 60

Construisez un intervalle de confiance `a95%pour la moyenne de la population.

⊳ La taille d’´echantillon est grande. Au 95%, l’intervalle de confiance pour la moyenne de la population est ´egal `a

x±a s

√n = 28.57±1.96

5.12184

√60

= [27.27,29.87].

Références

Documents relatifs

PR ´ EPARATION DES DONN ´ EES Pour pouvoir manipuler ce fichier (et faire des statistiques dessus), il faut le stocker dans une variable de type un peu sp´ ecial qu’on

Les r´esultats de l’extraction des cin´etiques pour les deux m´ethodes utilis´ees sont pr´esent´es respectivement dans les figures 6.36 (pour la m´ethode NMF-ALS) et 6.37 (pour

Grˆ ace au concept de distributions, il est possible de d´efinir convenablement des op´erations (d´erivation, transformation de Fourier) qui ne sont pas l´egitimes (qui n’ont pas

Pour cela, ` a partir d’un texte (en fran¸ cais par exemple), on calcule les probabilit´ es qu’une lettre donn´ ee se trouve im´ ediatement apr` es une autre lettre donn´ ee1.

Ce travail rassemble trois ´etudes parues dans diff´erentes revues math´ematiques, cit´ees ci-dessous, et concernant chacune des probl`emes de croissance de fonctions holomorphes

Le Professeur Pierre Lelong, dont les id´ees et les travaux ont largement inspir´e cette th`ese comme tant d’autres recherches actuelles, m’a fait l’honneur et la joie de bien

En premier lieu, nous avons ‘auscult´ e’ la puissance respective des cinq tests pour chacune des 10 lois consid´ er´ ees, ce en fonction du ou des param` etres associ´ e(s) ` a

Contrairement ` a la recherche dans un arbre quelconque o` u il faut parcourir quasiment tous les nœuds de l’arbre pour d´ eterminer si l’´ el´ ement existe, la recherche dans