Examen 2011 — Corrig´e Probabilit´e et Statistiques

(1)

Examen 2011 — Corrig´ e

Probabilit´e et Statistiques SIC

1. (i) Le nombre de boules rouges tirées suit une loi hypergéomètrique, donc p= C₃²C₆⁴−⁻3²

C₆⁴ = 0.6.

(ii) Il s’agit de la loi exponentielle exp(3) de fonction de répartitionF(x) = P(X ≤x) = 1−e⁻^3x, x >0. La médiane est le x >0 tel queF(x) = 1/2, soite⁻^3x= 1/2, c’est-à-dire

x= log(2)/3 = 0.2310.

(iii) On noteXi le r´esultat du d´esi,i= 1, . . . ,6. On cherche P(X1=X2=X3=X4=X5=X6) =

6

X

k=1

P(X1=X2=X3=X4=X5=X6=k).

Or la probabilité que les six dés montrentk,k= 1, . . . ,6 est (1/6)⁶. Donc la probabilité que les six dés montrent le même chiffre vaut

6/6⁶= 0.00013.

(iv) P(X < t) = 0.9 donct est le 90`eme quantile de la loi de student qui vaut selon la table de studentqt20(0.90) = 1.325.

(v) On aP(X ≤x) = 1−e⁻^x. Pour touty,

P(Y ≤y) =P(X≤e^y) = 1−e⁻^e^y. DoncY a pour densit´e

fY(y) =e^ye⁻^e^−y =e^y⁻^e^−y. (vi)X1+X2−3X3∼ N(0, σ²= 1 + 1 + 3²) =N(0,11)

(vii) SoitX∼ N(1,2).

P(q0.15< X < q0.95) = P(X < q0.95)−P(X < q0.15) = 0.95−0.15 = 0.80.

(viii) SoitX∼exp(λ) et Y ∼exp(λ),X etY ind´ependantes. Pour toutz >0, P(min{X, Y} ≥z) = P(X ≥z, Y ≥z) =P(X > z)P(Y > z)

= (e⁻^λz)²=e⁻^2λz, z >0.

Donc

P(min{X, Y} ≤k) = 1−e⁻^2λz, z >0 qui est la loi exp(2λ).

(ix)

M^X⁻^4Y = E[e^t(X⁻^4Y⁾] = E[e^tX]E[e⁻^4tY] = (1−t/2)⁻¹(1 + 4t/2)⁻¹= 2/{(2−t)(1 + 2t)}. (x) L’intervalle de confiance au niveau 95% pour la moyenne µ est une statistique sous forme

d’intervalle qui contientµ avec la probabilit´e 95%: P(−1.2≤µ ≤2.3) = 0.95. En d’autre terme, il y a 95% de chance que la moyenne soit comprise entre−1.2 et 2.3.

2. SoitX le résultat d’un essai médical. D’après l’énoncé,X∼ N(µ, σ²).

1

(2)

(a) Un test est anormal si|X−µ|>2σ.

P(|X−µ|>2σ) = P(|X−µ

σ |>2) =P(|Z|>2) = 2P(Z >2) = 2{1−P(Z ≤2)}

= 2{1−0.97725}= 0.0455, o`u Z∼ N(0,1).

(b)

(i) SoitY le nombre d’essais effectu´es avant le premier test anormal. On cherche iciP(Y = k−1), pourk= 1, . . ., qui vaut

P(Y =k−1) = (1−0.0455)^k⁻¹0.0455.

(ii) SoitZ le nombre de tests anormaux parmi les ntests. On sera alors considi´er´e comme anormal si Z≥1.

P(Z≥1) = 1−P(Z= 0) = 1−(1−0.0455)ⁿ>1/2

⇔ nlog(1−0.0455)<−log(2)

⇔ n >− log(2)

log(1−0.0455)= 14.89.

On aura plus de 50% de chance d’être déclaré anormal après 15 essais.

3. On poseXk= 1 si le k-`eme bit est correct etXk= 0 sinon.

(a) Il y a en tout 3nbits re¸cus. On calcule la probabilit´e qu’aucune erreur ait lieu:

P(Xi= 1, i= 1, . . . ,3n) = (1−p)³ⁿ

donc la probabilit´e qu’au moins une erreur de transmission ait lieu est 1−(1−p)³ⁿ. (b) Par votation par majorit´e, le bit est correctement reconstruit s’il y a eu 0 ou 1 erreur sur ce bit.

La probabilit´e qu’un bit reconstruit soit correct est alors P(X1= 1) = 3p(1−p)²+ (1−p)³= (1−p)²(1 + 2p), alors

Pn = P(Xi= 1,1≤i≤n) = P(X1= 1)ⁿ ={(1−p)²(1 + 2p)}ⁿ. (c) On a

nlim→∞Pn = lim

n→∞{(1−λ/n)²(1 + 2λ/n)}ⁿ=e⁻^2λe^2λ= 1

Donc il est certain que le protocol par votation par majorit´e donnera le bon message.

4. (a) La vraisemblance est L(θ;x1, . . . , xk) =

k

Y

i=1

n xi

θ^xⁱ(1−θ)ⁿ⁻^xⁱ, xi= 0,1, . . . , n, 0< θ <1 et la log-vraisemblance

l(θ;x1, . . . , xk) =

k

X

i=1

log{ n

xi

}+

k

X

i=1

{xilogθ+ (n−xi) log(1−θ)}, xi = 0,1, . . . , n, 0< θ <1

∝ logθ

k

X

i=1

xi+ log(1−θ)

n

X

i=1

(n−xi).

La dérivée par rapport àθ est

l^′(θ;x1, . . . , xk) =1 θ

k

X

i=1

xi− 1 1−θ

k

X

i=1

(n−xi),

2

(3)

qui s’annule lorsque

1−θ

θ = 1

θ−1 = Pk

i=1(n−xi) Pk

i=1xi

⇔ 1 θ =

Pk

i=1(n−xi) Pk

i=1xi

+ 1 = nk Pn

i=1xi

⇔ θ= Pk

i=1xi

nk = X¯k

n .

(b) Le nombre de points marqués par un étudiant suit une loi binomiale de paramètresn= 6 et θ. D’après (a), l’estimateur de maximum de vraisemblance deθ est

θˆ= P15

i=1xi

6×15 = 4/9 = 0.4445.

En supposantk= 15 assez grand pour se placer dans le cas asymptotique, θˆ∼ N^. (θ, J(ˆθ)⁻¹),

où J(ˆθ) est l’information observée égale à−l^′′(ˆθ;x1, . . . , xk). On a l^′′(ˆθ;x1, . . . , xk) = −1

θˆ²

k

X

i=1

xi− 1

(1−θ)ˆ²(nk−

k

X

i=1

xi)

= −nk

(1−θ)ˆ² + (−1

θˆ² + 1 (1−θ)ˆ²)

k

X

i=1

xi

= −nk

(1−θ)ˆ² + −1 + 2ˆθ θˆ²(1−θ)ˆ²

k

X

i=1

xi

= 1

(1−θ)ˆ²(−nk+−1 + 2ˆθ θˆ²

k

X

i=1

xi), ce qui donne

J(ˆθ) = 364.49.

Donc θˆ∼ N^. (θ,0.0027).

Un IC `a 95% pourθest

[ˆθ−zα/2

q

J(ˆθ)⁻¹,θˆ−zα/2

q J(ˆθ)⁻¹] o`u α= 0.05 etzα/2= 1.96. On obtient donc l’IC

[0.3426,0.5463].

(c) Un étudiant réussit l’examen avec la probabilité

P(Z≥3) =P(Z= 3) +P(Z= 4) +P(Z = 5) +P(Z = 6) où Z est une variable aléatoire binomiale de paramètresn= 6 et ˆθ= 4/9. Donc

P(Z ≥3) = 0.5472.

Parmi les 85 étudiants restants, le nombre de ceux ayant réussi le test suit une loi binomiale de paramètres n = 85 et p = 0.5472. Donc sur les 85 étudiants restants, en moyenne 0.5472×85 = 46.51 ont réussi le test.

3

(4)

5. (a) On suppose que le retardX du train est gaussienN(µ, σ²) oùµ etσ² sont ici inconnus. Un IC à 95% du retard moyenµest donné par

[ ¯X− S

√ntn−1(α/2),X¯ + S

√ntn−1(α/2)]

où n = 10, α= 0.05, tn(α) est le (1−α)-quantile de la loi de Student à (n−1) degrés de liberté (tn−1(α/2) = 2.262 ici), ¯X = 36,S²= 1410. On obtient l’IC:

[36−√

141×2.262,36 +√

141×2.262] = [9.14,62.86].

(b) 0 n’est pas dans l’IC à 95% donc un départ à l’heure (retard nul) n’est pas dans les normes (au seuil 95%).

(c) Avec ce changement, ¯X = 90,S²= 33450. On obtient l’IC:

[90−√

3345×2.262,90 +√

3345×2.262] = [−40.82,220.82].

0 est dans l’IC donc un départ à l’heure serait dans les normes. Néanmoins, l’IC obtenu n’a pas de sens ici car il est extrêmement large et contient des valeurs négatives!

(d) L’hypothèse de normalité n’est pas crédible car un retard ne peut pas être négatif. Il faudrait utiliser une loi ayant pour supportR⁺. On pourrait par exemple utiliser la loi exponentielle qui modélise habituellement les temps d’attente.

4