Estimation
A. Godichon-Baggioni
I. Mod`ele statistique
M OD ELE STATISTIQUE `
D´efinition
Une exp´erience statistique est la donn´ee d’un objet al´eatoireX`a valeurs dans un espace mesurable(E,E)et d’une famille de loi (Pθ)θ∈Θsuppos´ee contenir la loi deX, et appel´ee mod`ele statistique pour la loi deX.
E XEMPLES
Exemple 1 : pile ou face.On aE={0,1}n. On a
X= (X1, . . . ,Xn)avecXi∼ B(θ)avecθinconnu. Le mod`ele statistique est donc
(Pθ)θ∈Θ= B(θ)⊗n
θ∈[0,1]
Exemple 2 : taille des hommes adultes.La taille des hommes adultes est mod´elis´ee par une loi normale de param`etresµ, σ2 inconnus. Ici,E=RnetE =B(Rn)etX= (X1, . . . ,Xn)avec Xi∼ N µ, σ2
i.i.d, et (Pθ)θ∈Θ=
N µ, σ2⊗n
(µ,σ2)∈R×R∗+
M OD ELE PARAM ` ETRIQUE ´
D´efinition
Si l’espaceΘdes param`etres du mod`ele statistique(Pθ)θ∈Θest contenu dansRdpour un certain d∈N∗, on parle de mod`ele param´etrique. Sinon on parle de mod`ele non param´etrique.
E XEMPLES
Exemple 1 : le lancer de pi`ece.Le mod`ele est param´etrique car [0,1]⊂R.
Exemple 2 : taille des hommes adultes.Le mod`ele est param´etrique carR×R∗+⊂R2.
Exemple 3 : taille des hommes adultes.On consid`ere que la taille ne suit pas une loi normale mais une loi inconnue sur [0.5,2.5]. On suppose que cette loi est `a densit´ef par rapport `a la mesure de Lebesgue. Dans ce cas,Θcorrespond `a l’ensemble des densit´es sur[0.5,2.5]ce qui est clairement de dimension infinie. Le mod`ele est donc non param´etrique.
M OD ELE IDENTIFIABLE `
D´efinition
Le mod`ele statistique(Pθ)θ∈Θest dit identifiable si l’application θ7−→Pθest injective.
Exemple 1 : lancer de pi`ece.Le mod`ele(B(θ))θ∈[0,1]est identifiable.
Exemple 2 : taille des hommes adultes.Le mod`ele N µ, σ2⊗n
(µ,σ2)∈R×R∗+
est identifiable mais pas le mod`ele N µ, σ2⊗n
(µ,σ)∈R×R∗
M OD ELE DOMIN ` E ´
D´efinition
Le mod`ele(Pθ)θ∈Θsur(E,E)est dit domin´e si il existe une mesure σ-finieλsur(E,E)telle que, pour toutθ∈Θ, on a Pθ<< λ, i.e
∀A∈ E, λ(A) =0⇒Pθ(A) =0. La mesureλest alors appel´ee mesure dominante.
Exemple 1 : le lancer de pi`ece.Une mesure dominante de Qθ= (1−θ)δ0+θδ1estλ=δ0+δ1.
Exemple 2 : la taille des hommes adultes. Le mod`ele est domin´e par la mesure de Lebesgue surR.
II. D´efinitions
S TATISTIQUE ET ESTIMATEUR
On noteX= (X1, . . . ,Xn).
D´efinition
Une statistique T(X)est une fonction mesurable de l’objet al´eatoire Xne d´ependant pas deθ(mais d´ependant ´eventuellement de
param`etres connus). Un estimateur deθest une statistiqueθˆ=θ(X) destin´ee `a approcherθ.
Exemple : Lancer de pi`ece
Attention !Ne pas confondre estimateur et estimation !
Notation : Dans ce qui suit, on consid`ere un estimateurθˆndeθ.
E RREUR QUADRATIQUE MOYENNE
D´efinition
On suppose queθest `a valeurs dansΘ⊂R. L’erreur quadratique moyenne (ou risque quadratique) de l’estimateurθˆnest d´efini pour toutθ∈Θpar
EQM
θˆn, θ
=E
θˆn−θ2 .
Remarquons que grˆace `a l’in´egalit´e de Markov, pour toutc>0,
P h
θˆn−θ ≥ci
≤ EQM θˆn, θ
c2 .
B IAIS D ’ UN ESTIMATEUR
D´efinition
On appelle biais d’un estimateurθˆndeθla quantit´e B
θˆn, θ
=E hθˆni
−θ.
1. S’il est nul, on dit que l’estimateur est sans biais ou non biais´e 2. Si
B θˆn, θ
−−−−−→
n→+∞ 0,
on dit que l’estimateur est asymptotiquement sans biais.
Exemple : lancer de pi`eceL’estimateurθˆnest sans biais.
D ´ ECOMPOSITION B IAIS -V ARIANCE
Proposition
Soitθˆnun estimateur deθ, on a
EQM
θˆn, θ
=B θˆn, θ2
+V hθˆni
.
Exemple : lancer de pi`eceCommeθˆnest un estimateur sans biais deθ, on a
EQM
θˆn, θ
=V hθˆni
= θ(1−θ)
n .
C ONVERGENCE , CONSISTANCE ET NORMALIT E ´
ASYMPTOTIQUE D´efinition
On dit que l’estimateurθˆnest 1. convergent ou consistant si
θˆn−−−−−P →
n→+∞ θ, 2. fortement consistant si
θˆn−−−−−p.s→
n→+∞ θ,
3. asymptotiquement normal si il existeσ2 >0tel que
√n
θˆn−θ L
−−−−−→
n→+∞ N 0, σ2 .
III. M´ethode des moments
M ´ ETHODE DES MOMENTS Proposition
SoitΘun intervalle ouvert deRetθ∈Θ. Soitϕun C1-diff´eomorphisme deΘdansϕ(Θ). Soitϕˆnun estimateur
consistant deϕ(θ), alorsθˆn=ϕ−1( ˆϕn)est un estimateur consistant deθ, i.e
θˆn−−−−−P →
n→+∞ θ.
De plus, siϕˆnest un estimateur asymptotiquement normal deϕ(θ), i.e si il existeσ2>0tel que
√n( ˆϕn−ϕ(θ))−−−−−L →
n→+∞ N 0, σ2 ,
et siϕ0(θ)6=0, alorsθˆnest un estimateur asymptotiquement normal deθet
√n
θˆn−θ L
−−−−−→
n→+∞ N 0, σ2
(ϕ0(θ))2
! .
M ´ ETHODE DES MOMENTS
La m´ethode des moments consiste `a trouver un C1-diff´eomorphismeϕet un momentktel queE
Xk1
=ϕ(θ).
Comme un estimateur demkest donn´e par mˆn,k= 1
n
n
X
i=1
Xki
on obtient l’estimateur
θˆn=ϕ−1( ˆmn,k)
E XEMPLES
Exemple : la loi uniforme.On consid`ere des variables al´eatoires i.i.dX1, . . . ,Xnsuivant une loi uniforme sur
0, θ2 , avecθ >0, i.e de densit´efθd´efinie pour toutx∈Rpar
fθ(x) = 1
θ21[0,θ2](x).
Exemple : la loi exponentielle. SoientX1, . . . ,Xndes variables al´eatoires i.i.d suivant une loi exponentielle de param`etre θ >0, i.e de densit´efθd´efinie pour toutx∈R,
fθ(x) =θexp (−θx)1R+(x).
IV. M´ethode du Maximum de
Vraisemblance
(L OG ) V RAISEMBLANCE
SoitXun objet al´eatoire et(Pθ)θ∈Θun mod`ele statistique domin´e par une mesureνet de densit´egθ=dPdνθ.
D´efinition
La vraisemblance deXest d´efinie pour toutθ∈Θpar LX(θ) =gθ(X).
La log-vraisemblance deXest d´efinie pour toutθ∈Θpar lX(θ) = log (LX(θ)) = log (gθ(X)).
R EMARQUES ET EXEMPLES
Remarque : SiX= (X1, . . . ,Xn)∼P⊗nθ , on a LX(θ) =
n
Y
i=1
gθ(Xi) lX(θ) =
n
X
i=1
ln (gθ(Xi))
et on noteLX(θ) =Ln(θ)etlX(θ) =ln(θ).
Exemple 1 : cas discret. SoitX= (X1, . . . ,Xn)∼B(θ)⊗navec θ∈(0,1). On a
Ln(θ) =θnXn(1−θ)n−nXn
Exemple 2 : cas continu. SoitX= (X1, . . . ,Xn)∼ E(θ)⊗n, avec θ >0. On a
Ln(θ) =θnexp −nXnθ .
E STIMATEUR DU M AXIMUM DE V RAISEMBLANCE D´efinition
Un estimateur du maximum de vraisemblance (EMV) deθ, si il existe, est un ´el´ementθˆndeΘtel que
Ln
θˆn
= sup
θ∈ΘLn(θ)⇔ln
θˆn
= sup
θ∈Θln(θ).
Exemple 1 : cas discret. SoitX= (X1, . . . ,Xn)∼B(θ)⊗navec θ∈(0,1). On a
θˆn=Xn.
Exemple 2 : cas continue. SoitX= (X1, . . . ,Xn)∼ E(θ)⊗n, avec θ >0. On a
θˆn=X−1n .
R EMARQUE
Remarque : Siθˆnest un estimateur du maximum de vraisemblance deθ,ϕ
θˆn
est un estimateur du maximum de vraisemblance deϕ(θ).
Exemple : la loi exponentielle. Soit
X= (X1, . . . ,Xn)∼ E(θ)⊗n, avecθ >0, alorsXnest l’estimateur du maximum de vraisemblance deE[X1] =θ−1.
C OMMENT TROUVER L ’EMV
Soit l’EMV peut ˆetre donn´e ”explicitement” par la
vraisemblance, soit il est souvent plus facile de maximiser la log-vraisemblance. Pour cela, voici quelques options
possibles :
I Dresser le tableau de variations de la log vraisemblance I Chercher les z´eros de la d´eriv´ee, i.e r´esoudre
∂
∂θlX(θ) =0.
I V´erifier qu’il(s) maximise(nt) la log-vraisemblance (´etude de la concavit´e, ...)
A LGORITHME DE N EWTON
Il arrive que l’on ne soit pas capable de calculer explicitement l’estimateur du maximum de vraisemblance, et ce, mˆeme si il existe. On peut alors l’approcher `a l’aide d’algorithmes d’optimisation, et notamment l’algorithme de Newton :
I On choisit un point initialθ0. I Pour toutt∈N∗,
θt+1=θt−(l00n(θt))−1l0n(θt)
I On arrˆete quand un crit`ere de convergence est satisfait.
V. Quantiles
S TATISTIQUES D ’ ORDRE
D´efinition
Soit X1, . . . ,Xnun ´echantillon. Les n statistiques d’ordre
X(1), . . . ,X(n)s’obtiennent en rangeant l’´echantillon dans l’ordre, i.e on a
X(1)≤...≤X(n).
F ONCTION DE R EPARTITION EMPIRIQUE ´
La fonction de r´epartition empiriqueFnd’un ´echantillon X1, . . . ,Xnest d´efinie pour tout r´eelxpar
Fn(x) = 1 n
n
X
i=1
1]−∞,x](Xi) = 1 n
n
X
i=1
1]−∞,x] X(i)
.
De mani`ere ´equivalente, on a Fn(x) = 1
nCard{i,Xi≤x}= 1 nCard
i,X(i)≤x = 1 nsup
i,X(i)≤x .
C ONVERGENCE
Proposition
SoitX= (X1, . . . ,Xn)des variables al´eatoires ind´ependantes et identiquement distribu´ees de fonction de r´epartition F. Pour tout r´eel x, on a
I Loi :
nFn(x)∼ B(n,F(x)). I Convergence :
Fn(x)−−−−−p.s→
n→+∞ F(x).
I Normalit´e asymptotique :
√n(Fn(x)−F(x))−−−−−L →
n→=∞ N(0,F(x)(1−F(x))).
I NVERSE G EN ´ ERALIS ´ EE ´
D´efinition
Soit F une fonction de r´epartition. On appelle inverse g´en´eralis´ee de F la fonction d´efinie pour tout u∈[0,1]par
F−1(u) = inf{x∈R,F(x)≥u}.
P ROPRI ET ´ ES ´
Proposition
Soit F une fonction de r´epartition et F−1son inverse g´en´eralis´ee.
Alors :
1. F−1(0) =−∞.
2. F−1est croissante.
3. F−1est continue `a gauche.
4. Pour tout u∈[0,1],
F(x)≥u⇔x≥F−1(u).
5. Pour tout u∈[0,1], on a F◦F−1
(u)≥u et :
5.1 Si F est continue, F◦F−1=Id, mais si F n’est pas injective, il existe x0tel que F−1◦F
(x0)<x0.
5.2 si F est injective, alors F−1◦F=Id, mais si elle n’est pas continue, il existe u0tel que F◦F−1
(u0)>u0.
E XEMPLES
Exemple 1 : loi uniforme.SoitX∼ U([0,1]), alors sa fonction de r´epartitionFest continue mais pas injective et
F−1◦F
(2) =1<2.
Exemple 2 : SoitY∼ N(0,1),B∼ B(1/2)etX=BY. La fonction de r´epartition deXn’est pas continue en 0 et
F◦F−1
(1/2) =F(0) = 3 4 > 1
2.
M ´ ETHODE INVERSE
Proposition
Soit U une variable al´eatoire suivant une loi uniforme sur[0,1], F une fonction de r´epartition et F−1son inverse g´en´eralis´ee. Alors
I la variable al´eatoire X=F−1(U)a pour fonction de r´epartition F.
I Si X a pour fonction de r´epartition F et si F est continue, alors F(X)suit une loi uniforme sur[0,1].
Q UANTILES EMPIRIQUES
D´efinition
Soit(X1, . . . ,Xn)un ´echantillon et Fnla fonction de r´epartition empirique associ´ee. Pour tout p∈[0,1], on note xp(n)le quantile empirique associ´e, i.e
xp(n) =F−1n (p) = inf{x∈R,Fn(x)≥p}=X(dpne), oud.eest la partie enti`ere sup´erieure.
Exemple : La m´ediane empirique estX(n/2)sinest pair et X(n+1)/2sinon.
C ONVERGENCE Th´eor`eme
Soient(X1, . . . ,Xn)i.i.d de fonction de r´epartition F, p∈(0,1)et xp
le p-quantile de F, alors :
I Si F est strictement croissante en xp, alors xp(n)−−−−−p.s→
n→+∞ xp. I Si F est d´erivable en xpde d´eriv´ee f xp
>0, alors
√n xp(n)−xp L
−−−−−→
n→+∞ N 0,p(1−p) f xp
2
! .
Exemple : SoitX∼ E(θ)avecθ >0. Alorsθˆn= ln(2)
xn(12)est un estimateur consistant deθet
√n
θˆn−θ L
−−−−−→
n→+∞ N
0, θ2
(ln2)2
.