Examen ` a Blanc : 1 avril 2011
Probabilit´e et Statistiques SIC
1. (i) Il y a 13 coeurs et 4 rois dont un roi de coeur, donc la probabilit´e d’obtenir un roi ou un coeur vaut (13 + 4−1)/52 = 16/52 = 4/13≈0.3076.
(ii) SoitX1 le r´esultat du premier d´e etX2le r´esultat du deuxi`eme d´e, alors P(X1= 5|X1+X2= 6) = P(X1= 5, X1+X2= 6)
P(X1+X2= 6) =P(X1= 5, X2= 1)
P(X1+X2= 6) =1/36 5/36 = 1/5.
(iii) Si X et Y sont ind´ependants,
var(1 + 2X−3Y) = var(2X) + var(3Y) = 4var(X) + 9var(Y) = 16 + 9 = 25.
(iv)
E(X) = Z 1
0
x×1dx= [x2
2 ]10= 1/2, E(X2) =
Z 1 0
x2×1dx= [x3
3 ]10= 1/3,
var(X) = E(X2)−E(X)2= 1/3−1/4 = 1/12.
(v) PuisqueX et Y sont id´ependants,
cov(2 + 3X+Y, Y −X−2) =−3var(X) + var(Y) =−2.
(vi) Notons par Dle disque de centre O et de rayonr, alors fX,Y(x, y) =
1
aire(D)= πr12, (x, y)∈D,
0, sinon.
(vii) On lit sur la tableq0.95= 1.645.
(viii) D’apr`es le th´eor`eme central limite
P(X1+· · ·+X100≤110) = P(X1+· · ·+X100−100
10 ≤110−100
10 ) = P(N(0,1)≤1) = 0.84.
(ix)
MX−3Y = E[et(X−3Y)] = E[etX]E[e−3tY] =e2(et−1)e3(e−3t−1).
(x) Puisqueσ= 1 est connue, on utilise le test normal dont la statistique est donn´ee par Xσ/¯−√θn0
avecθ0= 0 etn= 21 :
p−valeur= P(|Z|> zobs) = P(|Z|> 0.2−0
√1/√
21) = P(|Z|>0.9165)∼2(1−0.818)∼0.36 On accepte le test au seuil 100(1−α) siα < 36%, sinon on rejette le test. Siσ est connue alors on utilise un t-test `a la place du test normal. Sa statistique est donn´ee par √X¯−θ0
s2/√ n : p−valeur= P(|t21|> tobs) = P(|t21|> 0.2−0
√1.5/√
21) = P(|t21|>0.75)∼2(1−0.77) = 0.46.
On accepte le test siα <46% et on le rejette sinon.
2. (a) Introduisons les ´ev´enements :
– P2 =«la pi`ece choisie donne toujours pile»
– P3 =«la pi`ece choisie donne pile avec probabilit´e 2/3»
Si l’on notepp l’´ev´enement «obtenir deux piles en deux lancers», on a d’apr`es la formule des probabilit´es totales,
Pr(pp) = Pr(pp|P1) Pr(P1) + Pr(pp|P2) Pr(P2) + Pr(pp|P3) Pr(P3)
= 1
2·1 2 ·1
3 +1 3 +2
3· 2 3·1
3
= 61
108
≈ 0.56.
(b) On cherche la probabilit´e d’avoir choisi la pi`ece non biais´ee sachant que l’on a obtenu deux piles sur nos deux lancers. On utilise pour cela la formule de Bayes.
Pr(P1|pp) = Pr(pp|P1) Pr(P1) Pr(pp)
=
1 4·13
61 108
= 9
61
≈ 0.15.
(c) Notonsf l’´ev´enement«obtenir une face au troisi`eme lancer avec la mˆeme pi`ece».
Pr(f |pp) = Pr(f∩P1|pp) + Pr(f∩P2|pp) + Pr(f∩P3|pp) On peut ensuite ´ecrire
Pr(f∩P1|pp) = Pr(f∩P1∩pp) Pr(pp)
= Pr(f∩pp|P1) Pr(P1) Pr(pp)
=
1 2·14· 13
61 108
= 9
122.
On trouve de mˆeme Pr(f ∩P2|pp) = 0 et Pr(f∩P3|pp) = 18316. Ainsi, Pr(f |pp) = 59
366≈0.16.
3. Pour quef soit une densit´e, il faut que
1 = c
Z ∞
0
Z ∞
x
e−xe−ydydx
= c
Z ∞
0
e−x[−e−y]∞x dx
= c
Z ∞
0
e−2xdx
= c/2.
Donc
f(x, y) =
2e−xe−y, 0< x < y <∞,
0, sinon.
(a) La loi marginale de X est
fX(x) = Z ∞
x
2e−xe−ydy
= 2e−x[−e−y]∞x
= 2e−2x si 0< x.
La m´edianemest telle que P(X < m) =Rm
0 2e−2xdx= 1−e−2m= 1/2. Doncm= 1/2 log 2.
E[X] = Z ∞
0
2xe−2xdx
= [2x(−1
2e−2x)]∞0 − Z ∞
0
2(−1
2e−2x)dx
= Z ∞
0
e−2xdx= 1/2.
(b) Le temps d’attente de Xavier estX−Y, donc le temps moyen d’attente est donn´e par E[Y−X].
On a
fY(y) = Z y
0
2e−xe−ydx
= 2e−y[−e−x]y0
= 2e−y(1−e−y) si 0< y.
E[Y] = Z ∞
0
2y(e−y−e−2y)dy
= [2y(−e−y+1
2e−2y)]∞0 − Z ∞
0
2(−e−y+1
2e−2y)dy
= Z ∞
0
(2e−y−e−2y)dy
= [−2ey+1
2e−2y]∞0 = 3/2.
Donc
E[Y −X] = 3/2−1/2 = 1.
4. SoientX1, . . . , Xn
iid∼Pois(λ).
(a) La densit´e de Poisson est donn´ee parf(k) =e−λ λk!k, k= 0,1, .... La fonction de log vraisemblance est
l(λ) = Xn
1
log(e−λλXi Xi!)
= Xn
1
(−λ+Xilog(λ)−log(Xi!))
= −nλ+ Xn
1
Xilogλ− Xn
1
log(Xi!).
L’estimateur de maximum de vraisemblance est celui qui maximisel(λ), l′(λ) =−n+
Xn
1
Xi/λ.
Doncbλn = ¯X. Puisque E[ ¯X] = E[Xi] =λ, alors l’estimateur est non-biais´e.
(b) On sait que pournassez grand, l’estimateur de maximum de vraisemblance ˆλv´erifie λˆn .
∼ N(λ, J(ˆλn)−1), o`u J(ˆλn) est l’information observ´ee ´egale `a −l′′(ˆλn). On a
l′′(ˆλn) =− 1 λˆ2n
Xn
i=1
Xi,
donc
J(ˆλn) = Pn
i=1Xi
λˆ2n = n λˆn
= n X¯, On a donc
ˆλn .
∼ N( ¯X,X¯ n).
Un intervalle de confiance `a 99% est alors (en utilisant quez0.995= 2.58) [ ¯X−2.58p
X/¯ √
n,X¯ + 2.58p X/¯ √
n].
(c) La fonction de log vraisemblance est l(λ) =
Xr
1
log(e−2λ(2λ)Yi Yi! ) +
Xn
1
log(e−λ(λ)Xi Xi! )
= −2rλ+ Xr
1
Yilog 2λ− Xr
1
log(Yi!)−nλ+ Xn
1
Xilogλ− Xn
1
log(Xi!)
= −(2r+n)λ+ Xr
1
Yilog 2λ+ Xn
1
Xilogλ− Xr
1
log(Yi!)− Xn
1
log(Xi!).
L’estimateur de maximum de vraisemblance est celui qui maximisel(λ), l′(λ) =−(2r+n) + (
Xr
1
Yi+ Xn
1
Xi)/λ.
Doncbλ= (Pr
1Yi+Pn
1Xi)/(2r+n).
5. (a) Nous voulons tester si la moyenneµ(estim´ee par ¯X =Pn
i=1xi) du nombre de d´ecilitres par bouteille est (significativement) diff´erente de 2.5 ou non. Ainsi, la situation se formule comme suit :
SoitX1, . . . , Xn
iid∼(µ, σ2) correspondants `a la quantit´e dans lesn= 100 bouteilles (l’ind´ependance paraˆıt cr´edible). Les hypoth`eses nulles et alternatives sont :
H0 : µ= 2.5 H1 : µ6= 2.5
(b) Si les points du graphique ´etaient parfaitement align´es, nous pourrions en conclure imm´ediatement que nos observations sont tr`es probablement issues d’une loi normale (´etant donn´e que les quantiles empiriques correspondraient exactement aux quantiles th´eoriques d’une loi nor- male).
Dans notre cas, comme nous n’avons pas de ligne de r´ef´erence sur notre graphique, il est assez difficile de savoir si les points sont bien align´es ou si une l´eg`ere courbure est pr´esente.
N´eanmoins, il semble que les points ne sont pas loin d’une droite, malgr´e quelques disparit´es au niveau des queues (surtout `a gauche). Ainsi, en tenant compte de la variabilit´e associ´ee aux quantiles empiriques, l’hypoth`ese de normalit´e semble justifi´ee pour cette ´echantillon.
Pour plus de certitude, il faudrait r´ecolter plus de donn´ees.
(c) Dans le cas o`u les donn´ees sont suppos´ees ind´ependantes et identiquement distribu´ees selon la loiN(µ, σ2), nous savons que :
X¯ −µ
pS2/n∼tn−1, pour toutn >1,
o`u tn−1 est une loi de Student avecn−1 degr´es de libert´e. Par cons´equent, un intervalle de confiance exacte au niveau 1−2αpourµserait (sous l’hypoth`ese de normalit´e) :
X¯ ±qtn−1(α)p S2/n,
o`u qtn−1(α) d´enote le quantile de la loitn−1 correspondant `a la probabilit´eα. Or, dans le cas o`u le nombre de donn´ees est suffisamment grand (c’est-`a-dire plus que 30 environ), la loi de Student tn−1 est bien approxim´ee par une loi normale N(0,1) (avec quantiles zα). Par cons´equent, nous pouvons obtenir un intervalle de confiance approximatif :
X¯ ±zα
pS2/n.
Notons que ce mˆeme intervalle de confiance serait obtenu en relaxant l’hypoth`ese de normalit´e et en appliquant le th´eor`eme central limite pour ¯X.
L’application num´erique donne l’intervalle de confiance suivant au seuil 95% : X¯ ±z0.025
pS2/n= 2.3±1.96·p
0.4/100 = [2.18,2.42].
Comme 2.5 ne fait pas partie de l’intervalle de confiance `a 95%, nous pouvons rejeter l’hy- poth`ese nulleH0 et accepterH1.
Une autre mani`ere d’aborder ce probl`eme est de calculer la probabilit´e sous H0 d’observer une r´ealisation de ¯X correspondant `a 2.3. Pour ce faire, notons que sousH0 nous avons
X¯ ∼N(2.5, σ2/n), et donc
Zn=X¯−2.5
pS2/n ∼tn−1≈N(0,1).
L’application num´erique donneZn =−3.16. Puisque sousH0, Pr(|Zn|>3.16) = 0.00157, il est tr`es improbable queH0soit vraie. Par cons´equent, nous pouvons rejeter l’hypoth`ese nulle H0 et accepterH1.
(d) Nous voulons v´erifier si les donn´ees r´ecolt´ees (quantit´es dans les bouteilles) sont conformes avec la valeur standard qu’elles devraient avoir (2.5 dl). En d’autres termes, nous contrˆolons l’ad´equation des donn´ees au mod`ele statistique qui suppose que nos observations doivent avoir une moyenne de 2.5 (l’hypoth`eseH0). Nous supposons donc que la moyenne est r´eellement de 2.5 et v´erifions statistiquement (par la p-valeur) si les donn´ees observ´ees sont conformes avec cette hypoth`ese (si elles sont susceptibles -ou pas- d’avoir ´et´e g´en´er´ees par le mod`ele statistique suppos´e). Si cette probabilit´e est tr`es faible, nous pouvons en conclure avec certitude que l’hypoth`eseH0 est fausse (les donn´ees proviennent d’un autre mod`ele).