ÉCS2
Chapitre 11. Estimation ponctuelle et par intervalles
–Exercice11.1 Introduction à l’estimation ponctuelle
Depuis l’an dernier, nous avons étudié en détail un certain nombre de lois devenues usuelles. Une question demeure cependant : lorsqu’on pense qu’une variable suit une loi donnée, comment connaître, ou à défautestimer, son (ou ses) paramètre(s) ?
Imaginons qu’un phénomène X suive une loi de Poisson dont nous ignorons le para- mètreλ. PuisqueE(X) =λ, nous pouvons envisager d’observer un grand nombre de fois l’expérience et de calculer la moyenne empiriquexobtenue : elle devrait nous fournir une estimation deλ.
Dans toute la suite,ndésigne un entier au moins égal à2.
1. Loi de Poisson et visualisation informatique
Dans le script suivant, on fait tirer aléatoirement un paramètreλet on compare graphiquement la loiP(λ)etP(x).
//Choisir un paramètre lambda dans [[10,20]]
lambda=grand(1,1,"uin",10,20);
//Choisir le nombre de simulations n=input(’Nombre de simulations=’)
//Simuler n variables X(i) suivant P(lambda) X=grand(1,n,"poi",lambda);
//Valeur estimée de lambda : moyenne empirique des X(i) estim=mean(X);
//Histogramme des valeurs simulées absi=[0:1:2*lambda];
histplot(0.5+absi,X)
//Diagramme des probabilités de P(estim) ordo=exp(-estim)*estim.^absi./factorial(absi);
plot2d(absi,ordo,-3)
//Diagramme des probabilités de P(lambda)
ordo=exp(-lambda)*lambda.^absi./factorial(absi);
plot2d(absi,ordo,2) //Affichage des valeurs
disp(estim,’moyenne empirique =’) disp(lambda,’valeur réelle de lambda=’)
n= 100,x'16,87&λ= 17 n= 1000,x'13,926 &λ= 14 Soitλ∈] 0 ; +∞[,Xune variable aléatoire suivant la loi de Poisson de paramètre λet(X1, . . . ,Xn)unn−échantillon de X. On pose :
Sn déf.=
n
X
i=1
Xi etXn déf.= Sn
n. a)Quelle propriété assure que :Xn −→P λ?
b)DéterminerE(Xn). Déterminer lim
n→+∞V(Xn).
c) Que peut-on dire du comportement de la variableXn lorsquendevient grand ? 2. Exemple de la loi exponentielle
Soitλ∈ ] 0 ; +∞[,Y une variable aléatoire suivant la loi exponentielle de para- mètreλet(Y1, . . . ,Yn)unn−échantillon deY.
On pose :
Rn déf.=
n
X
i=1
Yi et Mn déf.= Yn= Rn
n .
a)Vers quelle variable la suite(Mn)converge-t-elle en probabilité ? b)On pose Un déf.= 1
Mn = n
Rn. Vers quelle variable la suite (Un)converge-t-elle en probabilité ?
c) Quelle est la loi deWn
déf.= λRn? CalculerE
1 Wn
et E
1 Wn2
.
d)En déduireE(Un)et V(Un). Que valent lim
n→+∞E(Un)et lim
n→+∞V(Un)? e)Afin d’obtenir une variable dont l’espérance vaut exactementλ, on pose :
Lycée HenriPoincaré 1/4 lo
ÉCS2
Chapitre 11. Estimation ponctuelle et par intervalles
–Vndéf.= n−1
n Un= n−1 Rn
.
Vérifier queE(Vn) =λet calculerV(Vn). Que peut-on dire du comportement de la variableVn lorsquendevient grand ?
f )À l’aide de l’inégalité de Bienaymé-Tchebychev, justifier que la suite(Vn)converge en probabilité versλ.
g)ComparerV(Un)etV(Vn). Quel estimateur vaudrait-il mieux utiliser pour estimer λ:Un ouVn?
Pour obtenir les graphiques suivants, on a fait choisirλau hasard, puis simulern variables exponentielles de paramètreλ, et on a placé en ordonnées les valeurs de Ui etVi pour iallant de10àn.
n= 500&λ'1,28 n= 10000&λ= 2,12
Exercice11.2 Comparaison des trois estimateurs d’un même paramètre
Dans une population, une variable aléatoire réelleX suit une loi uniforme à densité sur l’intervalle[0;a]. On cherche à estimer le réel positif a. On extrait au hasardn individus (avecn>3) et on note Xi la valeur prise parXpour leième individu. On suppose les Xi
indépendantes et de même loi queX.
Première idée : a est une borne supérieure...
... et on poseYn= sup
16i6n
(Xi).
1. Montrer queYn est un estimateur asymptotiqement sans biais dea.
2. Cet estimateur est-il sans biais ? Si non, que vaut son biaisbn? 3. On poseZn =n+ 1
n Yn. Vérifier queZn est un estimateur sans biais dea.
4. Montrer que les estimateursYn et Zn sont convergents.
Seconde idée : a est le double de l’espérance de X...
... et on pose :Tn= 2 n
n
X
i=1
Xi.
5. Montrer queTn est un estimateur sans biais dea.
6. Est-il convergent ?
Comparaison de ces estimateurs.
7. Calculer le risque quadratique de l’estimateurTn.
8. ParmiYn,ZneTn, quel est l’estimateur le plus efficace, c’est-à-dire celui de risque quadratique minimum ?
Exercice 11.3 Paramètres de la loi exponentielle généralisée.
Soita∈Retb∈] 0 ; +∞[. Soit
f :R−→R, x7−→
0 six6a
1 be−
x−a
b sinon
.
1. Vérifier quef est une densité de probabilité.
2. a)SoitX une v.a.r. admettantf pour densité. Quelle est la loi X−a b ? X suit la loi exponentielle généralisée de paramètresaet bet de logo E(a, b).
b)En déduireE(X)etV(X).
3. Soit(Xn)n>1 unn-échantillon deX. On poseYn= min
16i6nXi, a)Montrer queYn suit la loiE a,nb
.
b)Montrer queYn est un estimateur convergenta.
4. On poseZn= 1 n
n
X
i=1
(Xi−Yn)etUn =
n
X
i=1
Xi.
a)CalculerE(Zn)et exprimer V(Zn)en fonction de Cov(Un,Yn), de bet den.
b)En utilisant l’inégalité de|ρ(Un,Yn)|61, montrer que lim
n→+∞V(Zn) = 0.
c) En déduire queZn est un estimateur convergent deb.
Exercice 11.4 Trois estimateurs d’une probabilité liée à une loi de Poisson.
Soit (Xi)16i6n un n-échantillon d’une variable X suivant une loi de Poisson P(λ). On cherche un estimateur de e−λ, probabilité queXsoit nulle.
1. On pose :Sn=
n
X
i=1
Xi,Xn=Sn
n etZn =e−Xn.
a)Montrer queXn est un estimateur sans biais et convergent deλ.
b)Montrer queZn est un estimateur asymptotiquement sans biais de e−λ.
Lycée HenriPoincaré 2/4 lo
ÉCS2
Chapitre 11. Estimation ponctuelle et par intervalles
–c) Montrer queE(Z2n)tend vers e−2λ lorsquentend vers+∞.
d)Zn est-il un estimateur convergent de e−λ? 2. Pour chaquei∈[[1 ;n]], on définitYi par
Yi= 1 siXi= 0 et Yi= 0sinon.
a)Que représenteRn=
n
X
i=1
Yi pour len-échantillon ?
b)SoitTn=Rn
n . Montrer queTnest un estimateur sans biais et convergent de e−λ. 3. a)Montrer queUn =
1− 1
n Sn
est un estimateur sans biais de e−λ. b)Un est-il un estimateur convergent ?
4. Comparer ces trois estimateurs.
Exercice11.5 Un estimateur convergent de l’écart-type Soitn>2 et(Xi)16i6n unn-échantillon de la variableX.
On noteXn lanème moyenne empirique des Xi, µ l’espérance deX et σson écart-type, supposé non nul.
On définitla variance empirique Vn par Vn déf.= 1
n
n
X
i=1
Xi−Xn2 .
1. Montrer queVn= 1 n
n
X
i=1
X2i −X2n
2. En déduire queVn est un estimateur asymptotiquement sans biais deσ2. 3. Suppose queXpossède un moment centré d’ordre4noté µ4et on admet(1) que
V(Vn) =(n−1)2
n3 µ4−(n−1)(n−3) n3 σ4, Montrer queVn est un estimateur convergent deσ2.
4. En déduire un estimateur sans biais et convergentV0n deσ2. V0n s’appellela variance empirique corrigée.
5. Proposer deux estimateurs convergents deσ, l’un notéSnconstruit à l’aide deVn
et l’autre notéS0n à l’aide deVn0.
Sn s’appellel’écart-type empirique et S0n l’écart-type empirique corrigé.
Exercice11.6 Intervalle de confiance d’une loi normale.
Une machine produit des pièces dont la longueur est une variable aléatoireX.
(1). C’est un assez long calcul, basé uniquement sur la linéarité de l’espérance et l’indépendance deXi. Voir annexe en fin de fiche.
Une pièce estacceptablesi sa longueur est comprise entre 28,18et 28,22mm.
1. Dans un premier temps, on estime queXsuit une loi normaleN 28,20; 0,0122 . Calculer la probabilité qu’une pièce tirée au hasard soit jugée acceptable.
2. Sans mettre en cause l’écart-typeσ= 0,012car il ne dépend pas du réglage de la machine, on désire vérifier la valeur moyenneµde la longueur des pièces produites par l’analyse d’un échantillon. Quelle doit être la taille de l’échantillon pour obtenir qui placera µdans un intervalle de confiance d’amplitude 0,01mm centré en X, moyenne observée sur l’échantillon, au risque1%?
3. Sur un échantillon de 50 pièces prélevées au hasard, la moyenne observée est X = 28,095. Déterminer une estimation de l’intervalle confiance centré enXoù se trouveµau risque 1%.
4. On complète l’analyse par une étude des retours en usine pour non-conformité.
Sur 250 pièces expédiées, 21 ont été retournées. On notef déf.= 21 250.
Construire, pour estimer la probabilité ppour qu’une pièce produite ne soit pas acceptable, des intervalles au niveau de confiance95%, suivant les méthodes :
i.intervalle de confiance obtenu à l’aide de l’inégalité de Bienaymé-Tchebychev en majorantp(1−p)par1/4;
ii.intervalle de confiance asymptotique obtenu à l’aide du théorème limite central en majorantp(1−p)par1/4;
iii.intervalle de confiance asymptotique obtenu à l’aide du théorème limite central en estimant l’écart-type par l’écart-type empiriquep
f(1−f).
Données :
2,575×0,012 0,005
2
' 38,2; 2,575×0,012
√50 ' 0,0044; 21
250 ' 0,084 et 1,96
2√
250 '0,062,1,96p
f(1−f)'0,034,p
1/50'0,141.
Exercice 11.7 Construction d’un intervalle de confiance asymptotique pour une loi de Poisson.
Soit (Xi)16i6n un n-échantillon d’une variable X suivant une loi de Poisson P(λ). On cherche un intervalle de confiance deλ. On pose :Sn=
n
X
i=1
Xi et Λn= Sn
n. 1. Justifier que
√
nΛn−λ
√λ
converge en loi versN(0; 1)et quep Λn/λ
converge en probabilité vers1.
2. Justifier la propriété suivante : si(Un)converge en loi versUet(Vn)converge en probabilité vers1, alors UVn
n
converge en loi versU.
3. Justifier que √
nΛn−λ
√Λn
converge en loi vers N(0; 1), puis que, pour n assez
Lycée HenriPoincaré 3/4 lo
ÉCS2
Chapitre 11. Estimation ponctuelle et par intervalles
–grand, P
Λn−tα
qΛn
n 6λ6Λn+tα
qΛn
n
'αoùΦ(tα) =1 +α 2 .
4. Le nombre de poissons péchés quotidiennement dans le lac de Lancelot suit une loi de Poisson de paramètreλque l’on cherche à estimer. Une étude statistique menée sur360 jours donne une moyenne de90poissons par jour. Donner une estimation d’un intervalle de confiance asymptotique pourλde longueur2.
Exercice11.8 Pourquoi des intervalles de confiance symétriques ?
1. SoitX∗une variable gaussienne centrée réduite. Soit`un réel de] 0 ; +∞[. Étudier f :a7→P(a6X∗6a+`)pour déterminer pour quelle valeur de ala probabilité P(a6X∗6a+`)est maximum.
2. Quelle conséquence peut-on en tirer pour la construction d’intervalles de confiance à l’aide du théorème de la limite centrée ?
Annexe : calcul de la variance de l’ex.5
¬ Une autre expression de Vn. X
i,j
(Xi−Xj)2=X
i,j
(X2i −2XiXj+ X2j) =X
i,j
X2i −2X
i,j
XiXj+X
i,j
X2j
=nX
i
X2i −2X
i
XiX
i
Xj+nX
j
X2j
= 2nX
i
X2i −2n2Xn
X
i,j
(Xi−Xj)2= 2n2Vn
On va calculer V(Vn)à l’aide de la bilinéarité de la covariance : V(Vn) =Cov(Vn,Vn) = 1
4n4 X
i,j,k,`
Cov (Xi−Xj)2,(Xk−X`)2 .
Supposonsi=j ouk=`. Comme Cov(0,?) =Cov(?,0) = 0, Cov (Xi−Xj)2,(Xk−X`)2
= 0.
® Supposonsi, j, k, `tous différents. Alors(Xi−Xj)2et(Xk−X`)2sont indépendantes donc
Cov (Xi−Xj)2,(Xk−X`)2
= 0.
¯ Supposonsi6=j,k=i et`=j.
Cov (Xi−Xj)2,(Xi−Xj)2
=E((Xi−Xj)4)− E((Xi−Xj)2)2
Introduisonsµdans chaque calcul d’espérance.
(Xi−Xj)4= (Xi−µ)−(Xj−µ)4
= (Xi−µ)4−4(Xi−µ)3(Xj−µ) + 6(Xi−µ)2(Xj−µ)2
−4(Xi−µ)(Xj−µ)3+ (Xj−µ)4
E(Xi−µ) = 0pour toutiet l’indépendance deXi−µetXj−µpermettent de calculer l’espérance :
E (Xi−Xj)4
=µ4−4µ3×0 + 6σ2σ2−4×0×µ3+µ4
= 2µ4+ 6σ4.
(Xi−Xj)2= (Xi−µ)−(Xj−µ)2
= (Xi−µ)2−2(Xi−µ)(Xj−µ) + (Xj−µ)2 E (Xi−Xj)2
= 2σ2
Cov (Xi−Xj)2,(Xi−Xj)2
= 2µ4+ 2σ4.
° Supposonsi, j, k tous différents et` = j (i.e. un indice commun dans les deux fac- teurs).
Cov (Xi−Xj)2,(Xk−Xj)2
=E((Xi−Xj)2(Xk−Xj)2)
−E((Xi−Xj)2)E((Xk−Xj)2) (Xi−Xj)2(Xk−Xj)2= (Xi−µ)2+ 2(Xi−µ)(Xj−µ) + (Xj−µ)2
× (Xk−µ)2+ 2(Xk−µ)(Xj−µ) + (Xj−µ)2 On développe et on prend les espérances à la volée :
E((Xi−Xj)2(Xk−Xj)2) = 3σ4+µ4.
Cov (Xi−Xj)2,(Xk−Xj)2
=µ4−σ4.
± Maintenant, il reste à dénombrer combien termes de chaque sorte contient X
i,j,k,`
Cov (Xi−Xj)2,(Xk−X`)2 :
• typeet®: contribution nulle ;
• type¯: (k=iet`=j) ou (k=j et`=i), aveci6=j, soit 2n(n−1) termes ;
• type ° : [(` = i ou ` = j) et i, j, k différents] ou [(k = i ou k = j) et i, j, ` différents], soit2×2n(n−1)(n−2)termes.
Bilan : X
i,j,k,`
Cov (Xi−Xj)2,(Xk−X`)2
= 2n(n−1)(2µ4+2σ4)+4n(n−1)(n−2)(µ4−σ4)
= 4n(n−1)2µ4+ 4n(n−1)(n−3)σ4 En divisant par4n4,V(Vn) =(n−1)2
n3 µ4−(n−1)(n−3) n3 σ4.
Lycée HenriPoincaré 4/4 lo