• Aucun résultat trouvé

A.Godichon-Baggioni Estimation Mise`aniveau

N/A
N/A
Protected

Academic year: 2022

Partager "A.Godichon-Baggioni Estimation Mise`aniveau"

Copied!
35
0
0

Texte intégral

(1)

Estimation

A. Godichon-Baggioni

(2)

I. Mod`ele statistique

(3)

M OD ELE STATISTIQUE `

D´efinition

Une exp´erience statistique est la donn´ee d’un objet al´eatoireX`a valeurs dans un espace mesurable(E,E)et d’une famille de loi (Pθ)θ∈Θsuppos´ee contenir la loi deX, et appel´ee mod`ele statistique pour la loi deX.

(4)

E XEMPLES

Exemple 1 : pile ou face.On aE={0,1}n. On a

X= (X1, . . . ,Xn)avecXi∼ B(θ)avecθinconnu. Le mod`ele statistique est donc

(Pθ)θ∈Θ= B(θ)⊗n

θ∈[0,1]

Exemple 2 : taille des hommes adultes.La taille des hommes adultes est mod´elis´ee par une loi normale de param`etresµ, σ2 inconnus. Ici,E=RnetE =B(Rn)etX= (X1, . . . ,Xn)avec Xi∼ N µ, σ2

i.i.d, et (Pθ)θ∈Θ=

N µ, σ2⊗n

(µ,σ2)∈R×R+

(5)

M OD ELE PARAM ` ETRIQUE ´

D´efinition

Si l’espaceΘdes param`etres du mod`ele statistique(Pθ)θ∈Θest contenu dansRdpour un certain d∈N, on parle de mod`ele param´etrique. Sinon on parle de mod`ele non param´etrique.

(6)

E XEMPLES

Exemple 1 : le lancer de pi`ece.Le mod`ele est param´etrique car [0,1]⊂R.

Exemple 2 : taille des hommes adultes.Le mod`ele est param´etrique carR×R+⊂R2.

Exemple 3 : taille des hommes adultes.On consid`ere que la taille ne suit pas une loi normale mais une loi inconnue sur [0.5,2.5]. On suppose que cette loi est `a densit´ef par rapport `a la mesure de Lebesgue. Dans ce cas,Θcorrespond `a l’ensemble des densit´es sur[0.5,2.5]ce qui est clairement de dimension infinie. Le mod`ele est donc non param´etrique.

(7)

M OD ELE IDENTIFIABLE `

D´efinition

Le mod`ele statistique(Pθ)θ∈Θest dit identifiable si l’application θ7−→Pθest injective.

Exemple 1 : lancer de pi`ece.Le mod`ele(B(θ))θ∈[0,1]est identifiable.

Exemple 2 : taille des hommes adultes.Le mod`ele N µ, σ2⊗n

(µ,σ2)∈R×R+

est identifiable mais pas le mod`ele N µ, σ2⊗n

(µ,σ)∈R×R

(8)

M OD ELE DOMIN ` E ´

D´efinition

Le mod`ele(Pθ)θ∈Θsur(E,E)est dit domin´e si il existe une mesure σ-finieλsur(E,E)telle que, pour toutθ∈Θ, on a Pθ<< λ, i.e

∀A∈ E, λ(A) =0⇒Pθ(A) =0. La mesureλest alors appel´ee mesure dominante.

Exemple 1 : le lancer de pi`ece.Une mesure dominante de Qθ= (1−θ)δ0+θδ1estλ=δ01.

Exemple 2 : la taille des hommes adultes. Le mod`ele est domin´e par la mesure de Lebesgue surR.

(9)

II. D´efinitions

(10)

S TATISTIQUE ET ESTIMATEUR

On noteX= (X1, . . . ,Xn).

D´efinition

Une statistique T(X)est une fonction mesurable de l’objet al´eatoire Xne d´ependant pas deθ(mais d´ependant ´eventuellement de

param`etres connus). Un estimateur deθest une statistiqueθˆ=θ(X) destin´ee `a approcherθ.

Exemple : Lancer de pi`ece

Attention !Ne pas confondre estimateur et estimation !

Notation : Dans ce qui suit, on consid`ere un estimateurθˆndeθ.

(11)

E RREUR QUADRATIQUE MOYENNE

D´efinition

On suppose queθest `a valeurs dansΘ⊂R. L’erreur quadratique moyenne (ou risque quadratique) de l’estimateurθˆnest d´efini pour toutθ∈Θpar

EQM

θˆn, θ

=E

θˆn−θ2 .

Remarquons que grˆace `a l’in´egalit´e de Markov, pour toutc>0,

P h

θˆn−θ ≥ci

≤ EQM θˆn, θ

c2 .

(12)

B IAIS D ’ UN ESTIMATEUR

D´efinition

On appelle biais d’un estimateurθˆndeθla quantit´e B

θˆn, θ

=E hθˆni

−θ.

1. S’il est nul, on dit que l’estimateur est sans biais ou non biais´e 2. Si

B θˆn, θ

−−−−−→

n→+∞ 0,

on dit que l’estimateur est asymptotiquement sans biais.

Exemple : lancer de pi`eceL’estimateurθˆnest sans biais.

(13)

D ´ ECOMPOSITION B IAIS -V ARIANCE

Proposition

Soitθˆnun estimateur deθ, on a

EQM

θˆn, θ

=B θˆn, θ2

+V hθˆni

.

Exemple : lancer de pi`eceCommeθˆnest un estimateur sans biais deθ, on a

EQM

θˆn, θ

=V hθˆni

= θ(1−θ)

n .

(14)

C ONVERGENCE , CONSISTANCE ET NORMALIT E ´

ASYMPTOTIQUE D´efinition

On dit que l’estimateurθˆnest 1. convergent ou consistant si

θˆn−−−−−P

n→+∞ θ, 2. fortement consistant si

θˆn−−−−−p.s

n→+∞ θ,

3. asymptotiquement normal si il existeσ2 >0tel que

√n

θˆn−θ L

−−−−−→

n→+∞ N 0, σ2 .

(15)

III. M´ethode des moments

(16)

M ´ ETHODE DES MOMENTS Proposition

SoitΘun intervalle ouvert deRetθ∈Θ. Soitϕun C1-diff´eomorphisme deΘdansϕ(Θ). Soitϕˆnun estimateur

consistant deϕ(θ), alorsθˆn−1( ˆϕn)est un estimateur consistant deθ, i.e

θˆn−−−−−P

n→+∞ θ.

De plus, siϕˆnest un estimateur asymptotiquement normal deϕ(θ), i.e si il existeσ2>0tel que

√n( ˆϕn−ϕ(θ))−−−−−L

n→+∞ N 0, σ2 ,

et siϕ0(θ)6=0, alorsθˆnest un estimateur asymptotiquement normal deθet

√n

θˆn−θ L

−−−−−→

n→+∞ N 0, σ2

0(θ))2

! .

(17)

M ´ ETHODE DES MOMENTS

La m´ethode des moments consiste `a trouver un C1-diff´eomorphismeϕet un momentktel queE

Xk1

=ϕ(θ).

Comme un estimateur demkest donn´e par mˆn,k= 1

n

n

X

i=1

Xki

on obtient l’estimateur

θˆn−1( ˆmn,k)

(18)

E XEMPLES

Exemple : la loi uniforme.On consid`ere des variables al´eatoires i.i.dX1, . . . ,Xnsuivant une loi uniforme sur

0, θ2 , avecθ >0, i.e de densit´efθd´efinie pour toutx∈Rpar

fθ(x) = 1

θ21[0,θ2](x).

Exemple : la loi exponentielle. SoientX1, . . . ,Xndes variables al´eatoires i.i.d suivant une loi exponentielle de param`etre θ >0, i.e de densit´efθd´efinie pour toutx∈R,

fθ(x) =θexp (−θx)1R+(x).

(19)

IV. M´ethode du Maximum de

Vraisemblance

(20)

(L OG ) V RAISEMBLANCE

SoitXun objet al´eatoire et(Pθ)θ∈Θun mod`ele statistique domin´e par une mesureνet de densit´egθ=dPθ.

D´efinition

La vraisemblance deXest d´efinie pour toutθ∈Θpar LX(θ) =gθ(X).

La log-vraisemblance deXest d´efinie pour toutθ∈Θpar lX(θ) = log (LX(θ)) = log (gθ(X)).

(21)

R EMARQUES ET EXEMPLES

Remarque : SiX= (X1, . . . ,Xn)∼P⊗nθ , on a LX(θ) =

n

Y

i=1

gθ(Xi) lX(θ) =

n

X

i=1

ln (gθ(Xi))

et on noteLX(θ) =Ln(θ)etlX(θ) =ln(θ).

Exemple 1 : cas discret. SoitX= (X1, . . . ,Xn)∼B(θ)⊗navec θ∈(0,1). On a

Ln(θ) =θnXn(1−θ)n−nXn

Exemple 2 : cas continu. SoitX= (X1, . . . ,Xn)∼ E(θ)⊗n, avec θ >0. On a

Ln(θ) =θnexp −nXnθ .

(22)

E STIMATEUR DU M AXIMUM DE V RAISEMBLANCE D´efinition

Un estimateur du maximum de vraisemblance (EMV) deθ, si il existe, est un ´el´ementθˆndeΘtel que

Ln

θˆn

= sup

θ∈ΘLn(θ)⇔ln

θˆn

= sup

θ∈Θln(θ).

Exemple 1 : cas discret. SoitX= (X1, . . . ,Xn)∼B(θ)⊗navec θ∈(0,1). On a

θˆn=Xn.

Exemple 2 : cas continue. SoitX= (X1, . . . ,Xn)∼ E(θ)⊗n, avec θ >0. On a

θˆn=X−1n .

(23)

R EMARQUE

Remarque : Siθˆnest un estimateur du maximum de vraisemblance deθ,ϕ

θˆn

est un estimateur du maximum de vraisemblance deϕ(θ).

Exemple : la loi exponentielle. Soit

X= (X1, . . . ,Xn)∼ E(θ)⊗n, avecθ >0, alorsXnest l’estimateur du maximum de vraisemblance deE[X1] =θ−1.

(24)

C OMMENT TROUVER L ’EMV

Soit l’EMV peut ˆetre donn´e ”explicitement” par la

vraisemblance, soit il est souvent plus facile de maximiser la log-vraisemblance. Pour cela, voici quelques options

possibles :

I Dresser le tableau de variations de la log vraisemblance I Chercher les z´eros de la d´eriv´ee, i.e r´esoudre

∂θlX(θ) =0.

I V´erifier qu’il(s) maximise(nt) la log-vraisemblance (´etude de la concavit´e, ...)

(25)

A LGORITHME DE N EWTON

Il arrive que l’on ne soit pas capable de calculer explicitement l’estimateur du maximum de vraisemblance, et ce, mˆeme si il existe. On peut alors l’approcher `a l’aide d’algorithmes d’optimisation, et notamment l’algorithme de Newton :

I On choisit un point initialθ0. I Pour toutt∈N,

θt+1t−(l00nt))−1l0nt)

I On arrˆete quand un crit`ere de convergence est satisfait.

(26)

V. Quantiles

(27)

S TATISTIQUES D ’ ORDRE

D´efinition

Soit X1, . . . ,Xnun ´echantillon. Les n statistiques d’ordre

X(1), . . . ,X(n)s’obtiennent en rangeant l’´echantillon dans l’ordre, i.e on a

X(1)≤...≤X(n).

(28)

F ONCTION DE R EPARTITION EMPIRIQUE ´

La fonction de r´epartition empiriqueFnd’un ´echantillon X1, . . . ,Xnest d´efinie pour tout r´eelxpar

Fn(x) = 1 n

n

X

i=1

1]−∞,x](Xi) = 1 n

n

X

i=1

1]−∞,x] X(i)

.

De mani`ere ´equivalente, on a Fn(x) = 1

nCard{i,Xi≤x}= 1 nCard

i,X(i)≤x = 1 nsup

i,X(i)≤x .

(29)

C ONVERGENCE

Proposition

SoitX= (X1, . . . ,Xn)des variables al´eatoires ind´ependantes et identiquement distribu´ees de fonction de r´epartition F. Pour tout r´eel x, on a

I Loi :

nFn(x)∼ B(n,F(x)). I Convergence :

Fn(x)−−−−−p.s

n→+∞ F(x).

I Normalit´e asymptotique :

√n(Fn(x)−F(x))−−−−−L

n→=∞ N(0,F(x)(1−F(x))).

(30)

I NVERSE G EN ´ ERALIS ´ EE ´

D´efinition

Soit F une fonction de r´epartition. On appelle inverse g´en´eralis´ee de F la fonction d´efinie pour tout u∈[0,1]par

F−1(u) = inf{x∈R,F(x)≥u}.

(31)

P ROPRI ET ´ ES ´

Proposition

Soit F une fonction de r´epartition et F−1son inverse g´en´eralis´ee.

Alors :

1. F−1(0) =−∞.

2. F−1est croissante.

3. F−1est continue `a gauche.

4. Pour tout u∈[0,1],

F(x)≥u⇔x≥F−1(u).

5. Pour tout u∈[0,1], on a F◦F−1

(u)≥u et :

5.1 Si F est continue, F◦F1=Id, mais si F n’est pas injective, il existe x0tel que F−1◦F

(x0)<x0.

5.2 si F est injective, alors F−1◦F=Id, mais si elle n’est pas continue, il existe u0tel que F◦F1

(u0)>u0.

(32)

E XEMPLES

Exemple 1 : loi uniforme.SoitX∼ U([0,1]), alors sa fonction de r´epartitionFest continue mais pas injective et

F−1◦F

(2) =1<2.

Exemple 2 : SoitY∼ N(0,1),B∼ B(1/2)etX=BY. La fonction de r´epartition deXn’est pas continue en 0 et

F◦F−1

(1/2) =F(0) = 3 4 > 1

2.

(33)

M ´ ETHODE INVERSE

Proposition

Soit U une variable al´eatoire suivant une loi uniforme sur[0,1], F une fonction de r´epartition et F−1son inverse g´en´eralis´ee. Alors

I la variable al´eatoire X=F−1(U)a pour fonction de r´epartition F.

I Si X a pour fonction de r´epartition F et si F est continue, alors F(X)suit une loi uniforme sur[0,1].

(34)

Q UANTILES EMPIRIQUES

D´efinition

Soit(X1, . . . ,Xn)un ´echantillon et Fnla fonction de r´epartition empirique associ´ee. Pour tout p∈[0,1], on note xp(n)le quantile empirique associ´e, i.e

xp(n) =F−1n (p) = inf{x∈R,Fn(x)≥p}=X(dpne), oud.eest la partie enti`ere sup´erieure.

Exemple : La m´ediane empirique estX(n/2)sinest pair et X(n+1)/2sinon.

(35)

C ONVERGENCE Th´eor`eme

Soient(X1, . . . ,Xn)i.i.d de fonction de r´epartition F, p∈(0,1)et xp

le p-quantile de F, alors :

I Si F est strictement croissante en xp, alors xp(n)−−−−−p.s

n→+∞ xp. I Si F est d´erivable en xpde d´eriv´ee f xp

>0, alors

√n xp(n)−xp L

−−−−−→

n→+∞ N 0,p(1−p) f xp

2

! .

Exemple : SoitX∼ E(θ)avecθ >0. Alorsθˆn= ln(2)

xn(12)est un estimateur consistant deθet

√n

θˆn−θ L

−−−−−→

n→+∞ N

0, θ2

(ln2)2

.

Références

Documents relatifs

En vous appuyant sur les questions pr´ ec´ edentes, proposer une m´ ethode de simulation d’une suite de variables al´ eatoires de loi de Bernoulli de param` etre p = π/4.. (Il

[r]

La fonction de Möbius est une fonction qui possède diverses propriétés et qui est utilisée dans différentes branches des mathématiques.. Nous montrons ici deux de ses propriétés

[r]

D´ eterminer un intervalle de confiance asymptotique bilat´ eral sym´ etrique de niveau (1 −α) pour θ en utilisant chacun des estimateurs pr´ ec´ edents.. D´ eterminer un

Le fait que l'aire d'une bande sphérique soit égale à sa projection sur le cylindre de même rayon implique qu'une répartition uniforme de la direction du

[r]

Le moment des poids des masses est nul par rapport