Universit´e de Cergy-Pontoise 2010– 2011 L3 Math´ematiques, Statistiques
I. Ignatiouk, E. L¨ocherbach
Examen. Avril 2011
Les documents ne sont pas autoris´es. Dur´ee de l’´epreuve : 3 heures.
Exercice 1
Le nombre de demandes hebdomadaires d’un certain produit est une variable al´eatoire X de loi de PoissonP(ϑ), o`uϑ >0 est inconnu. On note X1,· · ·, Xnun n−´echantillon de loi P(ϑ) et on consid`ereX= n1(X1+. . .+Xn) et s2n−1 = n−11 Pni=1(Xi−X)2.
1.(QCM) 3 points (un demi point par bonne r´eponse) a) X est un estimateur sans biais deϑ: vrai.
b) s2n−1 est un estimateur sans biais deϑ: vrai.
c) X est un estimateur convergent de ϑ: vrai, par la loi des grands nombres.
d) s2n−1 est un estimateur convergent de ϑ: vrai, loi des grands nombres.
e) X est un estimateur de maximum de vraisemblance pour ϑ: vrai.
f) s2n−1 est un estimateur de maximum de vraisemblance pourϑ: faux.
g) X est une statistique exhaustive pour ϑ: vrai.
h) s2n−1 est une statistique exhaustive pourϑ: faux.
2.(QCM) 2 points (un par bonne r´eponse)
a) S=X1+· · ·+Xn suit la loi Binomiale B(n, ϑ): faux.
b) S=X1+· · ·+Xn suit la loi de Poisson de param`etre ϑ: faux.
c) S=X1+· · ·+Xn suit la loi de Poisson de param`etre nϑ : vrai.
d) S=X1+· · ·+Xn suit une loi Gaussienne (normale) : faux.
e) Lorsquen→ ∞, on peut approximer la loi deX par la loi Gaussienne N(µ, σ2) avec µ=σ2=ϑ : faux.
f) Lorsquen→ ∞, on peut approximer la loi deX par la loi Gaussienne N(µ, σ2) avec µ=ϑetσ2 = ϑ/n: vrai.
g) (n−1)s2n−1/ϑsuit la loi χ2n−1 : faux.
h) Y =√
n(X−ϑ)/sn−1 suit la loi de Student an−1 degr´es de libert´e : faux.
On souhaite maintenant estimer la probabilit´e p =Pϑ(Xi = 0). On note K le nombre de fois o`u l’on a observ´e X= 0 dans l’echantillon:
K =
n
X
i=1
11{Xi=0}.
3. 2 pointsCalculer p en fonction deϑ :
p=e−ϑ.
4. 1 + 2 points Identifier la loi de Yi = 11{Xi=0} et en d´eduire la loi de K :Yi suit une loi de Bernoulli de param`etre pet doncK une loi B(n, p),une loi binomiale.
5. 1 + 2 + 2 pointsMontrer queK/nest un estimateur sans biais :Comme K∼ B(n, p), E(K) =np), doncE(K/n) =p. et convergent :loi forte des grands nombres!, de p, puis que :
V arϑ(K/n) =e−2ϑ (eϑ−1)
n :
V arϑ(K/n) = 1
n2V arϑ(K)
= 1
n2nV arϑ(Y1)
= 1
np(1−p) = 1 np2(1
p −1).
Comme p=e−ϑ, cela implique le r´esultat.
6. 2 + 2 points Calculer l’information de Fisher contenue dans l’echantillon X1, . . . , Xn
sur ϑ. En d´eduire que l’estimateur K/n n’est pas optimal pour p : On calcule d’abord l’information de Fisher d’un 1−´echantillon. On commence par calculer la log-vraisemblance.
Soit x∈N.
h(ϑ, x) = logPϑ({x}) = log(e−ϑϑx/x!) =−ϑ+xlogϑ−log(x!).
On d´erive deux foix par rapport `aϑ:
∂2
∂ϑ2h(ϑ, x) =−x ϑ2.
On sait que l’information de Fisher du 1−´echantillon est donn´ee par I(1, ϑ) =−Eϑ ∂2
∂ϑ2h(ϑ, X1)
!
= 1
ϑ2Eϑ(X1) = 1 ϑ. Puis on utilise que l’information dun−´echantillon est donn´ee par
I(n, ϑ) =nI(1, ϑ) = n ϑ.
On calcule maintenant la borne de Cramer-Rao. Attention : on est en train d’estimer p=g(ϑ) =e−ϑ.La borne de Cramer-Rao est donc
(g0(ϑ))2
I(n, ϑ) =e−2ϑϑ n,
et il est facile de voir queV arϑ(K/n) est plus grand que cette quantit´e.
7. On va chercher `a am´eliorer cet estimateur en appliquant le th´eor`eme de Rao-Blackwell.
On poseT =E(Y1 |S). Rappelons qu’ ´etant donn´e une variable al´eatoireZ, E(Z |S) =g◦S
o`u g(s) = E(Z | S =s) est l’esp´erance de Z par rapport `a la loi conditionnelle sachant S=s.
i) 2 pointsFormuler le th´eor`eme de Rao-Blackwell : Cours!
ii) 2 + 1 pointsCalculer P(Xi = 0 |S=s) pour tout s∈Net en d´eduire que T = E(Yi |S) =
1− 1
n S
, ∀i= 1, . . . , n.
Tout d’abord :
P(Xi = 0|S=s) = P({Xi = 0} ∩ {S=s}) P(S =s) . Puis,
P({Xi = 0} ∩ {S=s}) =P(Xi = 0,
n
X
j=1,j6=i
Xj =s) =P(Xi = 0)P(
n
X
j=1,j6=i
Xj =s).
Or,Pnj=1,j6=iXj suit une loi de Poisson de param`etre (n−1)p,donc P(
n
X
j=1,j6=i
Xj =s) =e−(n−1)p((n−1)p)s s! , etP(Xi= 0) =p=e−ϑ.
De la mˆeme mani`ere,
P(S=s) =e−np(np)s s! . Donc on obtient finalement
P(Xi = 0|S=s) =
n−1 n
s
=
1− 1 n
s
. Puis on utilise queYi ne prend que deux valeurs 0 et 1,donc
E(Yi|S) =P(Yi= 1|S) =P(Xi = 0|S) =
1− 1 n
S
.
iii) 2 pointsV´erifier que T =E(K/n |S):
E(K/n|S) =E(1 n
n
X
i=1
Yi|S) = 1 n
n
X
i=1
E(Yi|S) = 1 n
n
X
i=1
1− 1
n S
=T.
iv) 4 pointsMontrer que
V arϑ(T) =e−2ϑeϑ/n−1 < V arϑ(K/n).
Tout d’abord,
V arϑ(T) =Eϑ(T2)−[Eϑ(T)]2.
Soit
g(t) =Eϑ(tS),
la fonction g´en´eratrice deS.CommeS suit une loi de Poisson de param`etre nϑ,nous avons que
g(t) =enϑ(t−1). (Il faut faire le calcul, mais c’est facile.)
Donc :
Eϑ(T2) =Eϑ
(1− 1 n)2S
=g((1− 1
n)2) =enϑ[(1−n1)2−1] =enϑ(n12−n2)=eϑn−2ϑ. D’autre part,
Eϑ(T) =g(1− 1
n) =enϑ((1−n1)−1) =e−ϑ, et donc finalement
V arϑ(T) =e−2ϑheϑ/n−1i. Il est assez facile de voir que
e−2ϑheϑ/n−1i≤e−2ϑ (eϑ−1) n . (On d´eveloppe la fonction exponentielle.)
Exercice 2
Une ´etude portant sur l’IQ d’enfants de cinq ans donne les valeurs suivantes : 103 112 97 98 111 85 113 97 102
On suppose que ces donn´ees sont la r´ealisation d’unn−´echantillonX1, . . . , Xnd’une loiN(m, σ2).
On poseX= (X1+· · ·Xn)/nets2n−1 = n−11 Pni=1(Xi−X)2. Aide au calculs : pour l’´echantillon observ´e,x= (x1+· · ·xn)/n = 102 et s2= n−11 Pni=1(xi−x)2= 1045/8 = 130,625.
1.(QCM) 2 points
a) La variable al´eatoire X suit la loi N(m, σ2): faux
b) La variable al´eatoire Y = σ/1√n(X−m) suit la loi de Student `a ndegr´es de libert´e : faux.
c) La variable al´eatoire Z = sX−m
n−1
√n suit la loi de Student `a n−1 degr´es de libert´e : faux.
d) La variable al´eatoireW = sX−m
n−1/√
n suit la loi de Student `andegr´es de libert´e : faux, c’est `a n−1 degr´es de libert´e!
e) La variable al´eatoire (n−1)s2n−1/σ2 suit la loi deχ2 `an−1 degr´es de libert´e : vrai ! On souhaite estimer le param`etre m par un intervalle de confiance au risque de 5%.
2.(QCM) 1 + 2 points
a) Il s’agit d’un intervalle [a, b] avec a, b ∈ R tels que P(m ∈ [a, b]) = 0,95 : ce n’est pas tout `a fait vrai, car tel que la r´eponse est formul´ee, a et b sont des constantes, donc d´eterministes. La r´eponse serait vrai si on rempla¸cait a, b∈R par a, b al´eatoires. 1 point pour ceux qui ont r´epondu vrai.
b) On utilisera la table de la loi N(0,1) : faux.
c) On utilisera la table de la loi de Student `a 9 degr´es de libert´e : faux, il faut utiliser celle de 8 ddl.
d) On utilisera la table de la loi de Student `a 8 degr´es de libert´e : vrai !
e) On utilisera la table de la loi χ2 `a 8 degr´es de libert´e : faux pour cette question. La table de la loi duχ2 sera utilis´ee pour estimer la variance!
3.(QCM) 1 + 2 pointsOn consid`ere les variables al´eatoiresY,Z etW d´efinies dans la question 1.
En utilisant les tables, on cherchera
a) u >0 tel que P(Y ≥u) =P(Y ≤ −u) = 0,025 : vrai (1 points), si on suppose queσ est connu.
b) u >0 tel que P(Y ≥u) =P(Y ≤ −u) = 0,05 : faux.
c) u >0 tel que P(|Z| ≤u) = 0,95 : faux, Z n’est pas la bonne variable.
d) u >0 et v >0 tels que P((n−1)s2n−1/σ2 ≤u) =P((n−1)s2n−1/σ2 ≤v) = 0,025 : faux : on ne veut pas estimer la variance.
e) u >0 tel que P(W ≤u) = 0,975 : vrai (2 points)
4.(QCU) 3 pointsOn d´eduit un intervalle de confiance [a, b] pour m au risque de 5%:
a) [a, b] = [102−0,6534σ; 102 + 0,6534σ] : faux.
b) [a, b] = [102−0,5483σ; 102 + 0,5483σ]: faux.
c) [a, b] = [102−6,918s; 102 + 6,918s] :faux.
d) [a, b] = [102−0,754s; 102 + 0,754s] : faux.
e) [a, b] = [102−0,7687s; 102 + 0,7687s] : vrai (3 points).
Preuve de e) : Tout d’abord il faut chercher u tel que P(W > u) = 0,025.
CommeW suit une loi de Student `a 8 ddl, on trouve dans la table : u= 2,31.
Rappelons que
W = X−m sn−1/√
n = 3X¯ −m s . Donc,
W > u⇔X¯ −m > s·u
3 = 0,77·s.
Donce) est vrai, car ¯X = 102.
Maintenant, on veut tester l’hypoth`ese H0 :m= 100 contre H1 :m= 108 au risque de premier esp`eceα= 0,1.
1.(QCM) 3 points
a) Le risque de premi`ere esp`ece α est ´egale `a la probabilit´e de se tromper en rejettant l’hypoth`ese H0 : vrai.
b) Le risque de premi`ere esp`eceαest ´egale `a la probabilit´e de se tromper lorsqueH0 est vraie : vrai.
c) Le risque de premi`ere esp`ece α est ´egale `a la probabilit´e de se tromper en acceptant l’hypoth`ese H0 : faux.
d) Le risque de deuxi`eme esp`eceβ est ´egale `a la probabilit´e de se tromper en rejettant l’hypoth`ese H0 : faux.
e) Le risque de deuxi`eme esp`eceβ est ´egale `a la probabilit´e de se tromper en acceptant l’hypoth`ese H0 : vrai.
2. 2 points Rappeler la d´efinition de la r´egion critique W d’un test : la d´ecision d’un test se fait usuellement `a l’aide d’une statistique de test T et de la r´egion critique W de telle mani`ere `a ce que lorsque{T ∈W}alors le test se d´ecide pour H1,sinon pour H0.
3.(QCU) 2 points Pour r´esoudre le probl`eme du test on utilisera une r´egion critique W du type W ={X−m∈I}
a) avec I =]− ∞, A], A∈R,etm= 102 :faux.
b) avec I =]− ∞, A], A∈R,etm= 100 : faux.
c) avec I =]− ∞, A], A∈R,etm= 108 : faux.
d) avec I = [A,+∞[, A∈R,etm= 100 : vrai.
e) avec I = [A,+∞[, A∈R,etm= 102 : faux.
f) avec I = [A,+∞[, A∈R,etm= 108 : faux.
4.(QCM) 2 + 2 points
a) D’apr`es le test, on doit accepter l’hypoth`eseH0 au risqueα= 0,1 : vrai.
b) On calcule le risque de deuxi`eme esp`eceβen utilisant la table de la loiN(0,1) : faux.
c) 0,2≤β ≤0,3 : vrai.
d) 0,4≤β ≤0,6 : faux.
e) β <0,2 : faux.
f) Si on change la valeur de α en prenant α = 0,05 alors la valeur de β va diminuer : faux.
Preuve : On cherche donc une r´egion critique du type {X¯ −100> A}.Pour contrˆoler le risque de premier esp`ece il faut calculer
P100( ¯X−100> A) =P100
X¯ −100 s/√
n >
√n s A
!
=P(W > 3 sA).
Il faut choisirA tel que
P(W > 3
sA)≤0,1.
D’apr`es la table,
3
sA= 1,4.
Donc
A= s
3·1,4 = 5,334.
Dans notre cas, ¯x−m= 2 et 2 n’est pas plus grand queA,donc le test ne rejette pasH0. Donc a) est vrai.
On va maintenant calculerβ :
β = P108( ¯X−100<5,334)
= P108( ¯X−108<5,334−8)
= P108( ¯X−108<−3,334)
= P(W <−3
s ·3,334)
= P(W >0,875).
Ici, W suit une loi de Student de 8 ddl. Nous avons que d’une part P(W >0,875)≤P(W >0,71) = 0,25 et d’autre part
P(W >0,875)≥P(W >0,89) = 0,2, donc
β ∈[0,2,0,25).
Finalement, pour voir que f) est faux, prenons α= 0,05.Donc d’apr`es la table, 3
sA= 1,86, doncA= 7,086.
Du coup
β=P(W < 3
s(A−8)) =P(W > 3
s·0,91) est plus grand que dans le casα= 0,1.