Estimation
A. Godichon-Baggioni
O BJECTIFS
On dispose de n donn´ees x 1 , . . . , x n qui sont des mesures d’une variable quantitative, et plus pr´ecis´ement des r´ealisations de variables al´eatoires ind´ependantes et identiquement
distribu´ees X 1 , . . . , X n . Objectifs :
I Estimer une caract´eristique θ de X 1 (moyenne, variance,...) I Estimer un param`etre θ de X 1 si cette variable est
param´etr´ee (loi de Bernoulli, normale, exponentielle,...) Exemples :
I Lancer de pi`ece : On s’int´eresse `a l’estimation de θ = E [X 1 ].
I Loi exponentielle : On s’int´eresse `a l’estimation du
param`etre θ = ( E [X 1 ]) −1 .
I. D´efinitions
S TATISTIQUE ET ESTIMATEUR
Dans ce qui suit, on consid`ere un ´echantillon X = ( X 1 , . . . , X n ) d´ependant d’un param`etre θ ∈ Θ , o `u Θ ⊂ R.
D´efinition
Une statistique T ( X ) est une fonction mesurable de l’´echantillon X ne d´ependant pas de θ (mais d´ependant ´eventuellement de param`etres connus). Un estimateur de θ est une statistique θ ˆ = θ ( X ) destin´ee `a approcher θ.
Exemple : Lancer de pi`ece
Attention ! Ne pas confondre estimateur et estimation !
Notation : Dans ce qui suit, on consid`ere θ ˆ n un estimateur de θ .
E RREUR QUADRATIQUE MOYENNE
D´efinition
On suppose que θ est `a valeurs dans Θ ⊂ R. L’erreur quadratique moyenne (ou risque quadratique) de l’estimateur θ ˆ n est d´efinie pour tout θ ∈ Θ par
EQM
θ ˆ n , θ
= E
θ ˆ n − θ 2 .
Remarquons que grˆace `a l’in´egalit´e de Markov, pour tout c > 0,
P h
θ ˆ n − θ ≥ c i
≤ EQM θ ˆ n , θ
c 2 .
B IAIS D ’ UN ESTIMATEUR
D´efinition
On appelle biais d’un estimateur θ ˆ n de θ la quantit´e B
θ ˆ n , θ
= E h θ ˆ n i
− θ.
1. S’il est nul, on dit que l’estimateur est sans biais ou non biais´e 2. Si
B θ ˆ n , θ
− −−−− →
n→+∞ 0,
on dit que l’estimateur est asymptotiquement sans biais.
Exemple : lancer de pi`ece. L’estimateur θ ˆ n est sans biais.
D ´ ECOMPOSITION B AIS -V ARIANCE
Proposition
Soit θ ˆ n un estimateur de θ , on a
EQM
θ ˆ n , θ
= B θ ˆ n , θ 2
+ V h θ ˆ n i
.
Exemple : lancer de pi`ece Comme θ ˆ n est un estimateur sans biais de θ , on a
EQM
θ ˆ n , θ
= V h θ ˆ n i
= θ( 1 − θ)
n .
C ONVERGENCE , CONSISTANCE ET NORMALIT E ´
ASYMPTOTIQUE D´efinition
On dit que l’estimateur θ ˆ n est 1. convergent ou consistant si
θ ˆ n − −−−− P →
n→+∞ θ,
2. fortement consistant si
θ ˆ n − −−−− p.s →
n→+∞ θ,
3. asymptotiquement normal si il existe σ 2 > 0 tel que
√ n
θ ˆ n − θ L
− −−−− →
n→+∞ N 0 , σ 2
.
II. Estimation de la moyenne et de la
variance
E STIMATION DE LA MOYENNE
Soient X 1 , . . . , X n des variables al´eatoires ind´ependantes et identiquement distribu´ees. Un estimateur naturel de la moyenne µ = E [ X 1 ] est donc
X n = 1 n
n
X
i=1
X i .
Proposition
1. X n est un estimateur sans biais et (fortement) consistant de µ . 2. Si σ 2 = V [ X 1 ] < +∞, alors X n est asymptotiquement normal
et
√ n X n − µ L
− −−−− →
n→+∞ N 0 , σ 2 EQM X n , µ
= σ 2
n .
E STIMATION DE LA MOYENNE
0 200 400 600 800 1000
0.350.400.450.500.550.60
●●
●
●
●●
●
●
●●
●
50 100 200 500 1000
0.400.450.500.550.60
F IGURE – Evolution de x
npar rapport `a n pour 4 ´echantillons (`a gauche) et boxplots pour les x
nobtenus pour
n = 50, 100, 200, 500, 1000 `a l’aide de 4000 ´echantillons (`a droite).
E STIMATION DE LA VARIANCE
Lorsque µ est connu, un estimateur naturel de la variance est V ˆ n = 1
n
n
X
i=1
( X i − µ) 2
V ˆ n est sans biais et fortement consistant.
Si µ est inconnue, on a la variance empirique ˆ
σ n 2 = 1 n
n
X
i=1
X i − X n
2
= 1 n
n
X
i=1
X i 2 − X 2 n .
E STIMATEUR SANS BIAIS DE LA VARIANCE
Proposition
ˆ
σ n 2 est un estimateur biaisi´e de σ 2 mais asymptotiquement sans biais.
Plus pr´ecis´ement, on a E
ˆ σ 2 n
= n − 1 n σ 2 .
D´efinition
L’estimateur sans biais de la variance S 2 n est d´efini par
S 2 n = n
n − 1 σ ˆ 2 n = 1 n − 1
n
X
i=1
X i − X n
2
= 1
n − 1
n
X
i=1
X 2 i − nX 2 n
!
.
E STIMATEUR SANS BIAIS DE LA VARIANCE
●
●
●
●●
●●
●●
●
50 100 200 500 1000
0.060.070.080.090.100.11
●
● ●
●●
●●
●
●
●
50 100 200 500 1000
0.060.070.080.090.100.11