Examen 2011 — Corrig´ e
Probabilit´e et Statistiques SIC
1. (i) Le nombre de boules rouges tir´ees suit une loi hyperg´eom`etrique, donc p= C32C64−−32
C64 = 0.6.
(ii) Il s’agit de la loi exponentielle exp(3) de fonction de r´epartitionF(x) = P(X ≤x) = 1−e−3x, x >0. La m´ediane est le x >0 tel queF(x) = 1/2, soite−3x= 1/2, c’est-`a-dire
x= log(2)/3 = 0.2310.
(iii) On noteXi le r´esultat du d´esi,i= 1, . . . ,6. On cherche P(X1=X2=X3=X4=X5=X6) =
6
X
k=1
P(X1=X2=X3=X4=X5=X6=k).
Or la probabilit´e que les six d´es montrentk,k= 1, . . . ,6 est (1/6)6. Donc la probabilit´e que les six d´es montrent le mˆeme chiffre vaut
6/66= 0.00013.
(iv) P(X < t) = 0.9 donct est le 90`eme quantile de la loi de student qui vaut selon la table de studentqt20(0.90) = 1.325.
(v) On aP(X ≤x) = 1−e−x. Pour touty,
P(Y ≤y) =P(X≤ey) = 1−e−ey. DoncY a pour densit´e
fY(y) =eye−e−y =ey−e−y. (vi)X1+X2−3X3∼ N(0, σ2= 1 + 1 + 32) =N(0,11)
(vii) SoitX∼ N(1,2).
P(q0.15< X < q0.95) = P(X < q0.95)−P(X < q0.15) = 0.95−0.15 = 0.80.
(viii) SoitX∼exp(λ) et Y ∼exp(λ),X etY ind´ependantes. Pour toutz >0, P(min{X, Y} ≥z) = P(X ≥z, Y ≥z) =P(X > z)P(Y > z)
= (e−λz)2=e−2λz, z >0.
Donc
P(min{X, Y} ≤k) = 1−e−2λz, z >0 qui est la loi exp(2λ).
(ix)
MX−4Y = E[et(X−4Y)] = E[etX]E[e−4tY] = (1−t/2)−1(1 + 4t/2)−1= 2/{(2−t)(1 + 2t)}. (x) L’intervalle de confiance au niveau 95% pour la moyenne µ est une statistique sous forme
d’intervalle qui contientµ avec la probabilit´e 95%: P(−1.2≤µ ≤2.3) = 0.95. En d’autre terme, il y a 95% de chance que la moyenne soit comprise entre−1.2 et 2.3.
2. SoitX le r´esultat d’un essai m´edical. D’apr`es l’´enonc´e,X∼ N(µ, σ2).
1
(a) Un test est anormal si|X−µ|>2σ.
P(|X−µ|>2σ) = P(|X−µ
σ |>2) =P(|Z|>2) = 2P(Z >2) = 2{1−P(Z ≤2)}
= 2{1−0.97725}= 0.0455, o`u Z∼ N(0,1).
(b)
(i) SoitY le nombre d’essais effectu´es avant le premier test anormal. On cherche iciP(Y = k−1), pourk= 1, . . ., qui vaut
P(Y =k−1) = (1−0.0455)k−10.0455.
(ii) SoitZ le nombre de tests anormaux parmi les ntests. On sera alors considi´er´e comme anormal si Z≥1.
P(Z≥1) = 1−P(Z= 0) = 1−(1−0.0455)n>1/2
⇔ nlog(1−0.0455)<−log(2)
⇔ n >− log(2)
log(1−0.0455)= 14.89.
On aura plus de 50% de chance d’ˆetre d´eclar´e anormal apr`es 15 essais.
3. On poseXk= 1 si le k-`eme bit est correct etXk= 0 sinon.
(a) Il y a en tout 3nbits re¸cus. On calcule la probabilit´e qu’aucune erreur ait lieu:
P(Xi= 1, i= 1, . . . ,3n) = (1−p)3n
donc la probabilit´e qu’au moins une erreur de transmission ait lieu est 1−(1−p)3n. (b) Par votation par majorit´e, le bit est correctement reconstruit s’il y a eu 0 ou 1 erreur sur ce bit.
La probabilit´e qu’un bit reconstruit soit correct est alors P(X1= 1) = 3p(1−p)2+ (1−p)3= (1−p)2(1 + 2p), alors
Pn = P(Xi= 1,1≤i≤n) = P(X1= 1)n ={(1−p)2(1 + 2p)}n. (c) On a
nlim→∞Pn = lim
n→∞{(1−λ/n)2(1 + 2λ/n)}n=e−2λe2λ= 1
Donc il est certain que le protocol par votation par majorit´e donnera le bon message.
4. (a) La vraisemblance est L(θ;x1, . . . , xk) =
k
Y
i=1
n xi
θxi(1−θ)n−xi, xi= 0,1, . . . , n, 0< θ <1 et la log-vraisemblance
l(θ;x1, . . . , xk) =
k
X
i=1
log{ n
xi
}+
k
X
i=1
{xilogθ+ (n−xi) log(1−θ)}, xi = 0,1, . . . , n, 0< θ <1
∝ logθ
k
X
i=1
xi+ log(1−θ)
n
X
i=1
(n−xi).
La d´eriv´ee par rapport `aθ est
l′(θ;x1, . . . , xk) =1 θ
k
X
i=1
xi− 1 1−θ
k
X
i=1
(n−xi),
2
qui s’annule lorsque
1−θ
θ = 1
θ−1 = Pk
i=1(n−xi) Pk
i=1xi
⇔ 1 θ =
Pk
i=1(n−xi) Pk
i=1xi
+ 1 = nk Pn
i=1xi
⇔ θ= Pk
i=1xi
nk = X¯k
n .
(b) Le nombre de points marqu´es par un ´etudiant suit une loi binomiale de param`etresn= 6 et θ. D’apr`es (a), l’estimateur de maximum de vraisemblance deθ est
θˆ= P15
i=1xi
6×15 = 4/9 = 0.4445.
En supposantk= 15 assez grand pour se placer dans le cas asymptotique, θˆ∼ N. (θ, J(ˆθ)−1),
o`u J(ˆθ) est l’information observ´ee ´egale `a−l′′(ˆθ;x1, . . . , xk). On a l′′(ˆθ;x1, . . . , xk) = −1
θˆ2
k
X
i=1
xi− 1
(1−θ)ˆ2(nk−
k
X
i=1
xi)
= −nk
(1−θ)ˆ2 + (−1
θˆ2 + 1 (1−θ)ˆ2)
k
X
i=1
xi
= −nk
(1−θ)ˆ2 + −1 + 2ˆθ θˆ2(1−θ)ˆ2
k
X
i=1
xi
= 1
(1−θ)ˆ2(−nk+−1 + 2ˆθ θˆ2
k
X
i=1
xi), ce qui donne
J(ˆθ) = 364.49.
Donc θˆ∼ N. (θ,0.0027).
Un IC `a 95% pourθest
[ˆθ−zα/2
q
J(ˆθ)−1,θˆ−zα/2
q J(ˆθ)−1] o`u α= 0.05 etzα/2= 1.96. On obtient donc l’IC
[0.3426,0.5463].
(c) Un ´etudiant r´eussit l’examen avec la probabilit´e
P(Z≥3) =P(Z= 3) +P(Z= 4) +P(Z = 5) +P(Z = 6) o`u Z est une variable al´eatoire binomiale de param`etresn= 6 et ˆθ= 4/9. Donc
P(Z ≥3) = 0.5472.
Parmi les 85 ´etudiants restants, le nombre de ceux ayant r´eussi le test suit une loi binomiale de param`etres n = 85 et p = 0.5472. Donc sur les 85 ´etudiants restants, en moyenne 0.5472×85 = 46.51 ont r´eussi le test.
3
5. (a) On suppose que le retardX du train est gaussienN(µ, σ2) o`uµ etσ2 sont ici inconnus. Un IC `a 95% du retard moyenµest donn´e par
[ ¯X− S
√ntn−1(α/2),X¯ + S
√ntn−1(α/2)]
o`u n = 10, α= 0.05, tn(α) est le (1−α)-quantile de la loi de Student `a (n−1) degr´es de libert´e (tn−1(α/2) = 2.262 ici), ¯X = 36,S2= 1410. On obtient l’IC:
[36−√
141×2.262,36 +√
141×2.262] = [9.14,62.86].
(b) 0 n’est pas dans l’IC `a 95% donc un d´epart `a l’heure (retard nul) n’est pas dans les normes (au seuil 95%).
(c) Avec ce changement, ¯X = 90,S2= 33450. On obtient l’IC:
[90−√
3345×2.262,90 +√
3345×2.262] = [−40.82,220.82].
0 est dans l’IC donc un d´epart `a l’heure serait dans les normes. N´eanmoins, l’IC obtenu n’a pas de sens ici car il est extrˆemement large et contient des valeurs n´egatives!
(d) L’hypoth`ese de normalit´e n’est pas cr´edible car un retard ne peut pas ˆetre n´egatif. Il faudrait utiliser une loi ayant pour supportR+. On pourrait par exemple utiliser la loi exponentielle qui mod´elise habituellement les temps d’attente.
4