ECE2 TP n ◦ 8 : Estimation
Exercice 1.
X¯n= 1 n
n
X
i=1
Xi est un estimateur sans biais et convergent de l’esp´erance commune aux variableXi.
SoientX1, X2, . . . , Xn des variables ind´ependantes suivant toutes la loi de Bernoulli B(p). Illustrer graphiquement la convergence de ¯Xn versppour une valeur depentr´ee par l’utilisateur en utilisant la fonctioncumsum.
Afin de voir l’´evolution de ¯Xn lorsquenaugmente, on cr´ee le vecteur suivant
X1,X1+X2
2 , . . . ,X1+X2+· · ·+Xn
n
. p = input(’entrez la valeur de p :’)
n = input(’entrez la valeur de n :’) x=1:n;
m=cumsum(grand(1,n,’bin’,1,p))./x;
plot2d(x,m) Exercice 2.
Donner une valeur approch´ee des int´egrales suivantes `a l’aide de la m´ethode de Monte-Carlo.
1.
Z 2
1
p1 +x5dx.
On remarque que
Ep
1 +X5
= Z 2
1
p1 +x5dx avecX ,→ U([1,2]).
On peut donc proposer
n = input(’entrer la valeur de n :’);
X = grand(1,n,’unf’,1,2);
I = 1/n*sum(sqrt(1+X.^5));
disp(I) 3.1480822 2.
Z +∞
0
e−x 1 +x4dx.
On remarque que
E 1
1 +X4
= Z +∞
0
e−x
1 +x4dx avecX ,→ E(1).
On peut donc proposer
n = input(’entrer la valeur de n :’);
X = grand(1,n,’exp’,1);
I = 1/n*sum(ones(1,n)./(1+X.^4));
disp(I) 0.6303056 3.
Z +∞
0
e−x2 1 +x2dx.
On remarque que E
1 1 +X2
= 1
√π Z +∞
−∞
e−x2
1 +x2dx= 2
√π Z +∞
0
e−x2
1 +x2dx avecX ,→ N
0,1 2
. On peut donc proposer
n = input(’entrer la valeur de n :’);
X = grand(1,n,’nor’,0, 1/sqrt(2));
I = sqrt(%pi)/2*1/n*sum(ones(1,n)./(1+X.^2));
disp(I) 0.6725788
Exercice 3.
Donner une valeur approch´ee des sommes suivantes `a l’aide de la m´ethode de Monte-Carlo.
1.
+∞
X
k=1
1 k32k.
On remarque que
E 1
X3
=
+∞
X
k=1
1
k32k avecX ,→ G 1
2
. On peut donc proposer
n = input(’entrer la valeur de n :’);
X = grand(1,n,’geom’, 1/2);
I = 1/n*sum(ones(1,n)./(X.^3)); // il peut y avoir une erreur de type ’division par z´ero’
disp(I) 0.5355922 2.
10
X
k=0
10 k
1
√1 +k4. On remarque que
10
X
k=0
10 k
1
√1 +k4 = 210
10
X
k=0
10 k
1
√1 +k4 1
2 k1
2 10−k
= 210
10
X
k=0
√ 1
1 +k4P(X=k) avecX ,→ B
10,1 2
.
= 210Ep
1 +X4 On peut donc proposer
n = input(’entrer la valeur de n :’);
X = grand(1,n,’bin’,10,1/2);
I = 1/n*sum(2^10*ones(1,n)./sqrt(1+X.^4));
disp(I) 64.875992 Exercice 4.
Soit un ´echantillon (X1, X2, . . . , Xn) de la loi uniforme sur [0, θ], avecθ >0 inconnu.
1. Montrer queβn=n+ 1
n max(X1, X2, . . . , Xn) est un estimateur sans biais et convergent deθ.
La variableUn= max(X1, X2, . . . , Xn) est `a valeurs dans [0, θ]. Pourx∈[0, θ], on a F(x) =P(Un ≤x) =P
n
\
i=1
[Xi≤x]
!
=
n
Y
i=1
P(Xi≤x) =x θ
n
On en d´eduit queUn poss`ede une densit´ef, en prenant par exemplef(0) =f(θ) = 0 f(x) =
(n xn−1
θn , six∈]0, θ[, 0, sinon.
Calculons l’esp´erance de βn.
Eθ(βn) = n+ 1
n Eθ(Un) = n+ 1 n
Z θ
0
tf(t)dt=n+ 1 n
n θn
Z θ
0
tndt=θ.
βn est donc un estimateur sans biais deθ. Calculons le second moment deUn. Eθ(Un2) =
Z θ
0
t2f(t)dt= n θn
Z θ
0
tn+1dt= nθ2 n+ 2.
Calculons le risque quadratique deβn. Commeβn est sans biais, calculons la variance deβn.
rθ(βn) = Vθ(βn) =
n+ 1 n
2
Vθ(Un2) =
n+ 1 n
2
nθ2 n+ 2 −
n n+ 1θ
2!
=
n+ 1 n θ
2n(n+ 1)2−n2(n+ 2) (n+ 2)(n+ 1)2
=
n+ 1 n θ
2 n (n+ 2)(n+ 1)2
= θ2
n(n+ 2) −→
n→+∞0.
βn est un estimateur sans biais et convergent deθ.
2. Montrer queZn = 2 n
n
X
i=1
Xi est un estimateur sans biais et convergent deθ.
On a
Eθ(Zn) = 2 n
n
X
i=1
Eθ(Xi) = 2 n
nθ 2 =θ.
Zn est donc un estimateur sans biais de θ. Calculons le risque quadratique de Zn. Comme Zn est sans biais, calculons la variance deZn.
rθ(Zn) = Vθ(Zn) = 4 n2
n
X
i=1
Vθ(Xi) par ind´ependance desXi
= 4
n2 nθ2
12 = θ2
3n −→
n→+∞0.
Zn est un estimateur sans biais et convergent deθ.
3. Simuler 1000 fois chacun de ces deux estimateurs et comparer leurs performances pour une valeur de θ et une valeur denentr´ees par l’utilisateur.
theta = input(’entrez la valeur de theta :’)
n = input(’entrez la valeur de n :’) // taille de l’´echantillon for k=1:n
X=grand(1,n,’unf’,0,theta) // loi uniforme `a densit´e betalist(k)=(n+1)/n*max(X);
Zlist(k)=2/n*sum(X);
end
beta = sum(betalist)/1000 // on effectue la moyenne empirique des beta obtenus Z = sum(Zlist)/1000 // on effectue la moyenne empirique des Z obtenus
disp(beta) disp(Z)
On a alors pourθ= 6 etn= 100 -->disp(beta)
0.6003284 -->disp(Z)
0.5940666
4. Confirmer cette impression en donnant les risques quadratiques deβn etZn. βn semble meilleur que Zn, puisque son risque quadratique rθ(βn) = θ2
n(n+ 2) alors que rθ(Zn) = θ2
3n. Ce qui permet de constater querθ(βn) tend plus vite vers 0 querθ(Zn). On a mˆeme :
rθ(βn) =
+∞o(rθ(Zn)). Exercice 5.
SoitX une variable al´eatoire suivant la loi de Bernoulli de param`etrepsuppos´e inconnu. On pose X¯n= 1
n
n
X
i=1
Xi o`u (X1, X2, . . . , Xn) est un ´echantillon de loiX.
1. Montrer que
X¯n− 1 2√
nα,X¯n+ 1 2√
nα
est un intervalle de confiance de pau niveau de confiance 1−α.
Si ¯Xn est la moyenne empirique associ´ee `a l’´echantillon, on a V( ¯Xn) = p(1−p)
n ≤ 1
4n,
car une simple ´etude de fonction montre que, pour toutp∈[0,1], p(1−p)≤ 14. Puisque ¯Xn est un estimateur sans biais de l’esp´erance, on en d´eduit que
∀ε >0, P
X¯n−p ≤ε
≥1−V( ¯Xn)
ε2 ≥1− 1 4nε2. Pourα= 4nε12, on a ε=2√1nα. On obtient donc pourα∈]0,1],
P
X¯n−p ≤ 1
2√ nα
≥1−α.
P
X¯n− 1 2√
nα ≤p≤X¯n+ 1 2√
nα
≥1−α.
L’intervalle
X¯n− 1 2√
nα,X¯n+ 1 2√
nα
est donc un intervalle de confiance pour θde niveau 1−α.
2. Simuler 100 ´echantillons de taille n= 500, construire les 100 intervalles de confiance obtenus avec l’in´egalit´e de Bienaym´e-Tchebychev et d´eterminer la proportion d’intervalles contenant p.
Pourn= 500 etα= 0.05, l’intervalle de confiance donn´e par l’in´egalit´e de Bienaym´e-Tchebychev est
X¯n− 1
10,X¯n+ 1 10
. p = input(’entrez la valeur de p :’)
n = input(’entrez la valeur de n :’) for k=1:100
x(k) = sum(grand(1,n,’bin’,1,p))/n;
end
y=sum(x-1/10<=p & x+1/10>=p)/100;
L’intervalle de confiance n’est pas tr`es pr´ecis, cela vient du fait que l’in´egalit´e de Bienaym´e-Tchebychev n’est pas tr`es pr´ecise.
3. En posant Φ(tα) = 1− α
2, on suppose que l’intervalle
"
X¯n−tα
pX¯n(1−X¯n)
√n ,X¯n+tα
pX¯n(1−X¯n)
√n
# est un intervalle de confiance asymptotique pourpau niveau de confiance 1−α.
Simuler 100 ´echantillons de taille n = 500, construire les 100 intervalles de confiance obtenus avec le th´eor`eme limite central et d´eterminer la proportion d’intervalles contenantp.
(Indication : pour calculer Φ−1(β)on utilise cdfnor(’X’,0,1,beta,1-beta)) Pourn= 500 etα= 0.05, on a
t=cdfnor(’X’,0,1,0.975,0.025) t =
1.959964
L’intervalle de confiance donn´e par le th´eor`eme limite central est
"
X¯n−1.96pX¯n(1−X¯n)
√n ,X¯n+1.96pX¯n(1−X¯n)
√n
# . p = input(’entrez la valeur de p :’)
n = input(’entrez la valeur de n :’) for k=1:100
x(k) = sum(grand(1,n,’bin’,1,p))/n;
end
c=1.96*sqrt(x.*(1-x))/sqrt(500);
y=sum(x-c<=p & x+c>=p)/100;