Solutionnaire `a l’examen final
note de cours
fréquence
30 40 50 60 70 80 90 100
012345
−1 0 1
405060708090
norm quantiles
la note finale pour le cours, sur 100
FIG. 1. Les r´esultats du cours.
I. Questions `a choix multiple
(1) [1 point] Une companie pharmaceutique teste un analgique chez 6 patients qui souffrent des migraines vestibulaires. Parmi les membres de ce groupe, 4ont ´et´e gu´eri. Sachant que 20% des migraines s’abaissent de toute fac¸on sans m´edicament, trouvez la probabilit´e que4 personnes ou plus seront gu´eri sans l’aide de l’analgique.
A) 0.0016 B) 0.25343 C) 0.35232 D) 0.01696 E) 0.99921
⊳SoitX le nombre des malades gu´eris sans l’aide de l’analgique dans un ´echantillon de6 personnes. La v.a.Xsuit la loi binˆomiale avecp= 0.2. On a :
P(X≥4) = P[X = 4] +P[X = 5] +P[X = 6]
= C640.240.82+C650.250.81+C660.26
= 0.01696
dev 1 mi−session dev 4 note
020406080100
résultats normalisés sur 100
FIG. 2. R´esultats comparatifs des tous les devoirs et les examens, ainsi que la note finale, normalis´es sur 100.
> choose(6,4)*0.2ˆ4*0.8ˆ2+choose(6,5)*0.2ˆ5*0.8+
+ choose(6,6)*0.2ˆ6 [1] 0.01696
La r´eponse correcte est D. ⊲
(2) [1 point] Vous vous rendez `a Las Vegas le jour de votre 25`eme anniversaire et vous pariez donc sur le num´ero25de la roulette. Vous gagnez. Vous pariez une seconde fois, tou- jours sur lr num´ero25, et vous gagnez encore ! Une roue de roulette a38cases (1`a36,0et 00) ; il y a donc une chance sur38qu’un tour se termine sur le25. Supposant que la roulette n’est pas biais´ee, quelle est la probabilit´e que deux tours cons´equtifs s’arrˆetent `a sur le25? A)1/38 = 0.026;
B)C382 /382 = 0.487; C)1/(38)2 =0.0007;
D)1/(25)2 = 0.0016; E)1/(25×38) = 0.0011.
⊳SoirAil’´ev`enement d’observer un25sur lei-`eme essai. CarA1etA2sont ind´ependants, on a
P(A1∩A2) =P(A1)P(A2) = 1/(38)2= 0.0007.
La bonne r´eponse est C. ⊲
(3) [1 point] Parmi les esp`eces des arbres qui peuplent un forˆet 20%sont l’´erable et15%
des arbres d’´erable ont entre 10 et 15 ann´ees. Nous choisissons un arbre au hasard dans cette forˆet. Quelle est la probabilit´e `a choisir un arbre d’´erable qui a entre 10 et 15 ans d’ˆage ?
A) 0.03 B) 0.15 C) 0.20 D) 0.75 E) 0.175
⊳ SoirM=“l´erable” etA=“entre 10 et 15 ans”. On sait quep(M) = 0.2etP(AkM) = 0.15. D’apr`es le th´eor`eme de multiplication, on en d´eduit
P(M∩A) = P(M)P(AkM) = 0.2×0.15 = 0.03. ⊲ La bonne r´eponse : A.
(4) [1 point] Un article rapporte que les membranes cellulaires ont en moyenne1201fmol de r´ecepteurs par milligramme de prot´eine membranaire, avec l’´ecart type d’´echantillon de 64fmol. Ces donn´ees proviennent de9exp´eriences. Calculez l’intervalle de confiance pour la moyenne de population de r´ecepteurs `a95%. (Supposez la population normale).
A)[1077,1329] B)[1139,1267] C)[0,1322] D)[1055,1351] E)[1098,1308]
Remarque : la formulation du probl`eme est inexact, c’est ma faute, il s’agit ici de l’´ecart type de la moyenne de la population observ´ee. Donc, la r´eponse est D, mais j’ai accept´e toutes les r´eponses o`u 64 a ’et´e trait´e litteralement, comme l’´ecart type d’´echantillon, est divis´e par√
3.
⊳L’intervalle de confiance au95%est voici :
x±t9.025−1sM = 1203±2.306 (64) = [1055.416,1350.584]. ⊲
(5) [1 point] Des mutations g´en´etiques ont ´et´e trouv´ees chez des patients avec la dystro- phie musculaire. Dans une ´etude, on a trouv´e des d´efauts dans le codage de g`ene qui code pour le complexe des sarcoglycanes chez 23 sur 180 patients atteint de la myopathie des ceintures. Construisez un intervalle de confiance au 90 % pour la proportion de la population des d´efauts de ce type chez les sujets atteints de la myopathie des ceintures.
A) [0.087,0.169] B) [0.187,0.269] C) [0.130,0.325] D) [0.179,0.277] E) [0.079,0.177]
⊳Voici l’intervalle de confiance pourπ au 90% : p±z.05
rp(1−p)
n = 23
180 ±1.645
r(23/180)(1−23/180)
180 = [0.087,0.169] ⊲
(6) [1 point] Vinght cochons ont ´et´e group´es en 10 couples de telle sorte que les deux cochons d’un mˆeme couple soient de poids similaires. Un cochon a ´et´e choisi al´eatoirement dans chaque couple pour r´ecevoir le r´egimeX, alors que le second recevait le r´egimeY. Les gains moyens de poids observ´es par jour sont les suivants :
couple 1 2 3 4 5 6 7 8 9 10
r´egimeX 21 21 19 16 26 19 18 29 27 19 r´egimeY 30 25 25 16 29 18 18 19 24 22
Peut-on dire que deux r´egimes sont statistiquement diff´erents ? Testez l’hypoth`ese perti- nente. Supposez que la diff´erence du gain de poids des cochons appari´es suit la loi normale.
A) les ´echantillons sont appari´es, on ´echoue `a rejeterH0, et le non rejet deH0ne permet pas dire que les r´egimes sont statistiquement diff´erents ;
B) les ´echantillons sont appari´es,H0 est rejet´ee et on en conclut que les r´egimes sont statis- tiquement diff´erents ;
C) les ´echantillons sont ind´ependants, on ´echoue `a rejeterH0, et le non rejet deH0ne permet pas dire que les r´egimes sont statistiquement diff´erents ;
D) les ´echantillons sont ind´ependants, on rejette l’hypoth`ese nulle et conclut que deux r´egimes sont statistiquement diff´erents ;
E) les ´echantillons sont appari´es,H0n’est pas rejet´ee, d’o`u on conclut que deux r´egimes sont statistiquement diff´erents.
⊳Les deux ´echantillons sont appari´es. On calcule le vecteur des diff´erences :
> x=c(21,21,19,16,26,19,18,29,27,19)
> y<-c(30,25,25,16,29,18,18,19,24,22)
> d <- x-y
> d
[1] -9 -4 -6 0 -3 1 0 10 3 -3
On cherche la moyenne d’´echantillon dedet l’´ecart type d’´echantillon ded:
> dbar [1] -1.1
> s <- sd(d)
> s
[1] 5.258855
(Bien sˆur que vous cherchez tout c¸ a avec une calculette).
L’hypoth`ese nulle nous dit que D = 0, l’hypoth`ese alternative que D 6= 0. Le test est bilateral.
La statistique du test :
> z0 <- dbar/(s/sqrt(length(d)))
> z0
[1] -0.6614568
Car n = 10, il faut utiliser la loi de Student avec 10−1 = 9 degr´es de libert´e. De cette fac con, on ne peut pas determiner la valeur p. La valeur critique donn´ee par la table3 qui correspond `aα= 5%est2.2622. C’est la valeur pour le test bilateral. Car
z0 =−0.6614568>−2.2622,
on ne peut pas rejeter l’hypoth`ese nulle. Il n’y a pas assez d’´evidence pour conclure que les
deux r´egimes sont statistiquement diff´erents. ⊲
(7) [1 point] L’´echelle de QI (= IQ) d’une certaine population a ´et´e cr´ee de sorte que la moyenne ´egale 100 et l’´ecart type15. On sait que la distribution de QI suit la loi normale.
Quelle proportion de la population a un QI sup´erieur `a135?
A)1%; B)2%; C)2.3%; D)35%; E) les donn´ees sont insuffisantes.
⊳ La valeur de la variable centr´ee r´eduite Z est ´egale `a z0 = (135−100)/15 = 2.333, donc
> pnorm(2.3333, lower.tail=FALSE) [1] 0.009816203
Bien sˆur que vous cherchez la valeur avec la table 1, d’o`uF(z0) = 0.9901et par cons´equent la r´eponse est
1−F(z0) = 1−0.9901 = 0.0099,
arrondie `a1%. ⊲
(8) [1 point] Les taux de cholest´erol (mg/dl) suivants ont ´et´e mesur´es chez10personnes : 260 150 160 200 210 240 220 225 210 240
Calculez l’´ecart-type d’´echantillon.
A)1200.3 B)34.6 C)236.2 D)32.9 E)211.5
⊳ s = v u u t
10
X
i=1
(xi−x)¯ 2/(10−1)
= v u u t
10
X
i=1
(xi−211.5)2/9
= p
10802.5/9
= √
1200.278
= 34.64503 ⊲
(9) [1 point] Les tailles d’une certaine population des plantes de ma¨ıs ont la moyenne de 145.0 cm et l’´ecart type de 22.0 cm. On choisit un ´echantillon al´eatoire den= 15plantes de ma¨ıs. Calculez l’´ecart type de la moyenne d’´echantillon de15plantes.
A) 22.0 B) 1.47 C) 15 D) 12.5 E) 5.68
⊳L’´ecart type de la moyenne d’´echantillon (l’erreur standard) est ´egal `aσ/√
n= 22/√ 15 =
5.68. ⊲
(10) [1 point] Soit la variable al´eatoireXprenant les valeurs0,1,2,5et8telle que : F(0) = 0.5;F(5) = 15/16;P[X= 2] =P[X = 8];P[X = 1] =P[X = 2] +P[X= 8].
(IciF note la fonction de r´epartition deX).
CalculezP[X = 5].
A)1/16; B)1/8; C)1/4; D)1/2; E)3/16.
⊳On a
0.5 =F(0) =P[X ≤0] =P[X = 0].
De plus,
P[X = 8] = 1−P[X≤5] = 1−F(5) = 1−15/16 = 1/16.
Par cons´equent,
P[X = 2] =P[X = 8] = 1/16, d’o`u on conclut :
P[X = 1] =P[X = 2] +P[X = 8] = 1/16 + 1/16 = 1/8.
Maintenant on sait les probabilit´es de toutes les valeurs sauf 5. Cela permet de calculer P[X = 5]:
P[X = 5] = 1−P[X = 0]−P[X = 1]−P[X = 2]−P[X= 8]
= 1−1/2−1/8−1/16−1/16
= 1/4.
⊲
(11) [1 point] Les tailles d’une certaine population des plantes de ma¨ıs ont la moyenne de 145.0 cm et l’´ecart type de 22.0 cm. Consid´erez un ´echantillon al´eatoire de n = 15 plantes de ma¨ıs. Supposez que la distribution de tailles suit la loi normale. Trouvezcde fac¸on que
P
X−145.0 s/√
15 > c
= 0.05,
o`uXetSsont respectivement la moyenne d’´echantillon et l’´ecart type d’´echantillon.
A) 1.761 B) 1.753 C) 1.96 D) 1.645 E) 2.145
⊳Puisque la variable al´eatoire
X−145.0 s/√
15
suit la loit14de Student avecn−1 = 14degr´es de libert´e, on ac=t140.05= 1.761. ⊲ (12) [1 point] Dans une lettre parue dans Nature (365 :992, 1992), on sugg´erait que les artistes avaient plus de garc¸ons que de filles. Pour v´erifier cette hypoth`ese, en cherchant dans Who is Who in Art, les chercheurs a trouv´e que les artistes avaient1834fils et1640filles. En guise de groupe de comparaison, les chercheurs ont port´e leur attention sur les4002enfants de non-artistes repris dans Who’s Who et ont trouv´e que le nombre des fils valait2046contre 1956pour les filles. Est-ce que l’exces de fils dans la descendence des artistes est une co¨ınci- dence au niveau de confiance de95%?
A) c’est une co¨ıncidence ; B) nous avons une forte ´evidence que la chance de avoir un garc¸on est plus grande dans la communaut´e des artistes ; C) les donn´ees sont insuffisantes.
⊳On veut tester l’hypoth`ese nulle H : π −π = 0contre l’hypoth`ese alternativeH : π1−π2 >0. ”Voici la valeur observ´ee de la statistique du test :
z0 = p1−p2
pp(1−p)p
1/n1+ 1/n2
= 1834/3474−2046/4002
p(1834 + 2046)/(3474 + 4002)[1−(1834 + 2046)/(3474 + 4002)]p
1/3474 + 1/4002
= 1.43.
Au95%, la valeur critique pour le test unilateral esta = 1.64, et car z0 = 1.43<1.64 =a,
on ne peut pas rejeterH0. Donc il semble ˆetre une co¨ıncidence. ⊲
(13) [1 point] Un chercheur voudrait savoir si la plupart des hommes n´es en 1946 sont plus grands que leur p`ere. D’un groupe de 250 sujets, on a d´ecouvert que 130 d’entre eux sont plus grands que leur p`ere, 100 sont plus court et 20 ont une taille ´egale `a celle de leur p`ere. Au niveau de confiance de 5 %, pouvons-nous dire que plus de 50 % des hommes n´es en 1946 ont une taille plus grande que celle de leur p`ere ?
Soitpla proportion des hommes n´es en 1946 qui sont plus grands que leur p`ere. Indiquez l’hypoth`ese nulle et l’hypoth`ese alternative et la conclusion correctes.
A) H0 : π = 0.5, H1 : p > 0.5. Il y a assez d’´evidence pour rejeter l’hypoth`ese nulle et conclure que plus de50%des hommes n´es en 1946 sont plus grands que leur p`ere.
B) H0 :π=0.5,H1 :π > 0.5. Il n’y a pas assez d’´evidence pour rejeter l’hypoth`ese nulle et conclure que plus de 50% des hommes n´es en 1946 sont plus grands que leur p`ere.
C) H0 : π = 0.5, H1 : π 6= 0.5. Il y a assez d’´evidence pour rejeter l’hypoth`ese nulle et conclure que plus de50%des hommes n´es en 1946 sont plus grands que leur p`ere.
D)H0 :π = 0.5, H1 :π 6= 0.5. Il n’y a pas assez d’´evidence pour rejeter l’hypoth`ese nulle et conclure que plus de50%des hommes n´es en 1946 sont plus grands que leur p`ere.
E) H0 : π = 0.5, H1 : π < 0.5. Il y a assez d’´evidence pour rejeter l’hypoth`ese nulle et conclure que plus de50%des hommes n´es en 1946 sont plus grands que leur p`ere.
⊳On veut testerH0 : π = 0.5, H1 :π > 0.5. Voici la valeur observ´ee de la statistique du test :
z0 = p−0.5
p0.5(1−0.5)/n = 130/250−0.5
p0.5(1−0.5)/250 = 0.632.
Car la valeur critique estz.05 = 1.645, la valeur observ´ee n’est pas dans le r´egion critique. Il n’y a pas d’assez d’´evidence pour conclure que plus de 50%des hommes n´es en 1946 sont
plus grands que leur p`ere. ⊲
(14) [1 point] Des ´etudes ant´erieures laissent supposer que le pourcentage de sujets de groupe sanguinAestπ = 40%dans une population d´etermin´ee. On se propose de s’en as- surer par un sondage portant sur un ´echantillon al´eatoire. Combien aurait-il fallu de sujets pour d’eterminer, au risque de5%, ce pourcentage avec un pr´ecision (=incertitude) de2%? (Note : ici il s’agit d’une pr´ecision absolue).
A)2305; B)1614; C)47; D)1613; E)2304.
⊳On a :
n =z.025
i 2
p(1−p) =
1.96 0.02
2
(0.4)(0.6) = 2304.96.
On en conclut : on a besoin den= 2305observations. ⊲
II. Questions `a r´eponse courte
(15) [4 points] Vous trouverez ci-dessous la longueurX du thorax (en millim`etres) d’un
´echantillon de mouches `a fruit masculines.
0.72 0.90 0.84 0.68 0.84 0.90 0.92 0.84 0.64 0.84 0.76 0.77 On peut v´erifier que :
12
X
i=1
xi = 9.65 et
12
X
i=1
x2i = 7.8497.
a) Donnez l’estimation ponctuelle de la longueur moyenne de la population.
b) Calculez l’´ecart type de la moyenne de la population estim´ee.
c) En supposant que la distribution de la longueur du thorax suit la loi normale, calculez un intervalle de confiance au95%pour la longueur du thorax moyenne de la population.
⊳(a) C’est la moyenne d’´echantillon : m= 1
12
12
X
i=1
xi = 9.65
12 = 0.8041667.
(b) On a, pour l’´ecart type de la moyenne d’´echantillon, sM = s
√n.
Donc, d’abord on calcule l’´ecart type d’´echantillon : s2 =
P12
i=1(xi−x)¯ 2 n−1
= P12
i=1x2i −12(¯x)2 n−1
= 7.8497−0.8041667×9.65 11
= 0.008135577, d’o`u
s=√
s2 =√
0.008135577 = 0.09019743.
Maintenant on a
sM = s
√n = 0.09019743
√12 = 0.02603780.
(c) La valeur critique
a=zα/2 =z0.025 = 1.959964, et voici l’intervalle de confiance :
m±asM = 0.8041667±1.959964×0.02603780
= 0.8041667±0.05103316
= [0.7531335,0.8551998].
⊲ (16) [4 points] Des ´etudes ant´erieures ont montr´e que 25% des infections graves sont dˆues `a des infections nosocomiales, que15%des infections graves non dˆues `a des infections nosocomiales provoquent un d´ec`es tandis que cette proportion s´el`eve `a30% quand il s’agit d’une infection grave dˆue `a une infection nosocomiale.
Dans un service hospitalier, un d´ec`es survient suite `a une infection grave. Qulle est la probabilit´e que le d´ec`es soit dˆu `a une infection nosocomiale ?
⊳Soient :
Dl´ev`enement “un d´ec`es apr`es une infection grave”, IN l´ev`enement “infection nosocomiale”.
D’apr`es les donn´ees du probl`eme on a :
P(IN) = 0.25 P(INc) = 0.75 P(DkIN) = 0.15 P(DkIN) = 0.3
La probabilit´e que le d´ec`es observ´e `a la suite d’une infection grave soit dˆu `a une infection nosocomiale s’exprime par :
P(INkD) L’application du th´eor`eme de Bayes donne :
P(INkD) = P(IN)·P(DkIN)
P(IN)·P(DkIN) +P(IN)·P(DkIN)
= 0.25·0.3 0.25·0.3 + 0.75·0.15
= 0.4.
⊲ (17) [4 points] Un agronome mesure le pourcentage de la teneur en eau dans un ´echantillon de 20 boisseaux de bl´e soumis `a une technique de s´echage sp´eciale. Voici le sommaire num´erique des donn´ees :
mean sd 0% 25% 50% 75% 100% n 7.26 0.303315 6.7 7 7.3 7.425 7.8 20
Si la teneur en eau moyenne d´epasse7.1, le processus de s´echage devrait ˆetre continu´e.
R´epondez aux questions trouv´ees ci-dessous afin de d´ecider : “Devrions-nous continuer le s´echage de la population du bl´e de laquelle l’´echantillon a ´et´e tir´e ?”
a) La figure 3 donne le r´esultat du test de comparaison quantile-quantile des teneurs en eau.
Quel est le but de ce test ? Discutez.
b) Formulez l’hypoth`ese nulle et l’hypoth`ese alternative concernant un param`etre de popula- tion pour r´epondre `a la question : “Devrions-nous continuer le s´echage de la population du bl´e de laquelle l’´echantillon a ´et´e tir´e ?”
c) Testez l’hypoth`ese de la partie (b) auα= 5%.
⊳(a) Le test est utilis´e pour d´ecider s’il est raisonnable de supposer que la teneur en eau est distribut´ee normalement. Car tous les points sur le diagramme se trouvent entre les bandes de confiance, une telle hypoth`ese semble ˆetre raisonnable.
(b) Notonsµla teneur en eau de la population. On veut tester H0 :µ= 7.1 contre H1 :µ >7.1.
(c) La valeur observ´ee de la statistique du test est voici : t0 = x−7.1
s/√
n = 7.26−7.1 0.303315/√
20 = 2.36.
La valeurpest ´egale `aP[T >2.36], o`uT suit la loitde Student avecn−1 = 19degr´es de libert´e. Puisque
t19.025 = 2.093 et t19.01= 2.539,
−2 −1 0 1 2
6.87.07.27.47.67.8
norm quantiles
humidity$humidity
FIG. 3.
on a 0.01 < p-value < 0.025. Auα = 5%, nous avons une forte ´evidence que la teneur en eau surpasse 7.1.
Donc, le s´echage du bl´e devrait ˆetre continu´e. ⊲
(18) [4 points]
Dans un article publi´e en 1994, Pullan et collaborateurs ont ´etudi´e l’utilisation de nicotine transdermique pour traiter la colite ulc´erieuse. Le niveau de nicotine plasmatique du groupe de contrˆole den1 = 45sujets sans traitement valait0.5±1.1ng/ml (moyenne±l’´ecart-type de la moyenne d’´echantillon). Le niveau plasmatique de n2 = 40sujets du groupe de trai- tement apr`es6semaines de traitement valait8.2±7.1ng/ml. L’augmentation de niveau de nicotine plasmatique apr`es le traitement est-elle statistiquement significative au99%? a) Quel test d’hypoth`ese utiliserez-vous ?
b) Formulez l’hypoth`ese nulle et l’hypoth`ese alternative.
c) Calculez la statistique du test.
d) Testez l’hypoth`ese et formulez votre conclusion.
⊳a) Les populations sont ind´ependantes et on a choisi deux grands ´echantillons, donc on va utiliser la statistiquez,
Z = X1 −X2 ps21/n1+s22/n2 afin de tester l’hypoth`ese sur deux moyennes :µ1 −µ2. b) On va tester
H0 :µ1−µ2 = 0 contre HA :µ1−µ2 <0,
o`u µ1 et µ2 sont les moyennes de population des niveaux de nicotine plasmatique dans le groupe de contrˆole et le groupe de traitement, respectivement.
c) La valeur de la statistique de test observ´ee est ’egale `a : z0 = 0.5−8.2
p(1.1)2+ (7.1)2 =−1.07.
d) La valeurpest voici :
P = 2P(Z >1.07) = 2 (1−F(1.07)) = 2 (1−.8577) = 0.2846.
Car la valeur pest grande, on ne peut pas rejeterH0. L’augmentation de niveau de nicotine plasmatique apr`es le traitement n’est pas statistiquement significative au99%.
Remarque : Veuillez noter que les tailles des ´echantillons ne servent que pour d´eterminer la loi de distrubtion de la statistique de test,Z (normale). ⊲