• Aucun résultat trouvé

Chap 2 : Vraisemblance, Estimation ponctuelle et Intervalle de Confiance

N/A
N/A
Protected

Academic year: 2022

Partager "Chap 2 : Vraisemblance, Estimation ponctuelle et Intervalle de Confiance"

Copied!
39
0
0

Texte intégral

(1)

Chap 2 : Vraisemblance, Estimation ponctuelle et

Intervalle de Confiance

(2)

Sommaire

1 Vraisemblance et Estimation

Vraisemblance, exhaustivité, liberté, complétude Information de Fisher

L’estimateur du maximum de vraisemblance Comportement asymptotique des estimateurs

2 Intervalle de Confiance

Construction pratique d’un Intervalle de Confiance Intervalle de Confiance Asymptotique

() Chap 2 : Vraisemblance, Estimation ponctuelle et Intervalle de Confiance2 / 45

(3)

Vraisemblance et Estimation Ponctuelle

(4)

Vraisemblance, exhaustivité, liberté, complétude

(5)

Vraisemblance d’un échantillon

Soitsn= (x1, . . . ,xn)réalisation d’un échantillon (i.i.d) de loi de

densité f(x;θ), dans un modèle statistiqueM, la vraisemblance de l’échantillon sn est la fonctionL(θ,x1, . . . ,xn) :

L: Θ −→ R+

θ 7→ f(x1, . . . ,xn;θ) =∏ni=1f(xi;θ) La log-vraisemblance est

L(θ,x1, . . . ,xn) = logL(θ,x1, . . . ,xn)

=

n

i=1

log(f(xi;θ)) Exemple :

(6)

Exhaustivité

Définition

Soit M={f(x,θ),x ∈X,θ∈Θ}un modèle paramétrique dominé et S :X −→Y une statistique. La statistique S est dite exhaustivesi la loi deX sachantS=s est indépendante deθ.

Caractérisation via le théorème de factorisation : Une statistique

S(x1, . . . ,xn) est exhaustive du modèle paramétrique (dominé par µ)

ssi la densité s’écrit

f(x1, . . . ,xn;θ) =gθ(S(x1, . . . ,xn);θ)h(x) Interprétation :S(x1, . . . ,xn) contient toute l’information de l’échantillon surθ, c’est unrésuméqui préserve l’information.

Propriété : SiS1,S2 sont des statistiques telles que S1=h(S2). Alors siS1 est exhaustive pourθ, alorsS2 est exhaustive pourθ.

Définition : Une statistiqueS estexhaustive minimale si tout autre statistique exhaustiveT s’écrit S=h(T).

() Chap 2 : Vraisemblance, Estimation ponctuelle et Intervalle de Confiance7 / 45

(7)

Exemples

L’échantillon lui-même Le cas multinomial Le cas gaussien Le cas uniforme

(8)

Liberté, Complétude

Dans un modèle paramétrique M, une statistiqueS est libreenθ si sa loi ne dépend pas deθ.

Une statistiqueS est complète ssi

∀θ∈Θ,Eθ[h(S)] =0 =⇒ h=0,Pθ−ps Théorème : Une statistique exhaustive complète est minimale.

Théorème de Basu : SiS est une statistique exhaustive complète pour le modèleM, alors toute statistique libreT est indépendante deS pour toute loiPθ deM.

I Interprétation : Les statistiques exhaustives complètes sont des résumés qui compressent et sépare l’échantillon de manière optimale, en deux partiesindépendantes.

() Chap 2 : Vraisemblance, Estimation ponctuelle et Intervalle de Confiance9 / 45

(9)

Estimation et exhaustivité

Théorème de Rao-Blackwell: Soit T une statistique exhaustive, et θˆ un estimateur deθ tel que R( ˆθ,θ) =Eθ

θˆ−θ

2

<∞, alors l’estimateur ηˆ=Eθh

θˆ|Ti

est l’amélioré de Rao-Blackwell : R( ˆη,θ)<R( ˆθ,θ)

Théorème de Lehmann-Scheffé: SoitS une statistique exhaustive complète pour un modèle paramétrique. Si θˆ est un estimateur sans biais deθ, alorsηˆ=Eθh

θˆ|Ti

est un estimateur sans biais uniformément de variance minimale.

Conclusion et interprétation : de bons résumés optimaux de l’échantillon permettent d’augmenter la précision. .

(10)

Le modèle exponentiel

Définition

Un modèle statistique {f(x;θ)|θ∈Θ}sur X =Rd est unefamille exponentiellesi les densitésf(x;θ) s’écrivent

f(x;θ) =exp

s

i=1

ηi(θ)Ti(x)−B(θ)

! h(x)

avech,B,ηi,Ti,i=1, . . . ,s à valeurs réels, eth(x)≥0.

T = (T1. . .Ts) est la statistique privilégiée du modèle (les Ti sont

linéairement libres = de rang plein)

Il est plus commode d’utiliser directement lesηi comme paramètre : la densité s’écrit alors sousforme canonique

f(x;η) =exp

s

i=1

ηiTi(x)−A(η)

! h(x)

et η= (η1, . . . ,ηs) est appelé paramètre naturel.

() Chap 2 : Vraisemblance, Estimation ponctuelle et Intervalle de Confiance11 / 45

(11)

Exemple : La loi Gamma

(12)

Propriétés

C(η) =exp(−A(η))est la constante de normalisation.

L’ensembleH={η∈Rs|RX exp(∑si=1ηiTi(x))<∞} est un convexe.

La fonctionη7→A(η)est indéfiniment dérivable et

1 Eη[T(X)] =ηA(η)

2 covη(Ti,Tj) = 2

∂ ηi∂ ηjA(η)

θ7→η(θ) est le plus souvent un difféomorphisme.

Pour une famille exponentielle, le modèle d’échantillonnage est encore une famille exponentielle avec la statistique privilégiée :

T(x1, . . . ,xn) =

n i=1

T(xi).

() Chap 2 : Vraisemblance, Estimation ponctuelle et Intervalle de Confiance13 / 45

(13)

Exhaustivité dans les familles exponentielles

Dans une famille exponentielle, si le modèle est de rang plein (égale à s), la statistique privilégiée est exhaustive minimale.

Réciproquement,

Théorème de Pitman-Koopman: Si le modèle est homogène (le support ne dépend pas du paramètre) et est tel que pour une taille d’échantillonn assez grand, il existe une statistique exhaustive de taille fixe s, alors la famille est exponentielle.

(14)

Information de Fisher

(15)

Score et Information de Fisher

On suppose que M ={f(x;θ),θ∈Θ} estrégulier. Lescoreest le vecteur aléatoire

S(X;θ) =∇θlogf(X;θ) Dans ce cas, ∀θ∈Θ,

Eθ[∇θlogf(X;θ)] =0 Attention au support !

La matrice d’information de FisherI(θ), ou information apportée par X sur θ :

I(X;θ) =covθ(∇θlogf(X;θ))

Additivité de l’Information de Fisherpour un échantillon i.i.d : I(X1, . . . ,Xn;θ),In(θ) =nI1(θ)

(16)

Calcul de l’Information de Fisher

Théorème : Si 2

∂ θi∂ θjf(x;θ) existe pour toutx et toutθ, et si on peut dériver 2 fois sous le signe intégral Rf(x;θ)µ(dx) alors

I(X;θ) =−

Eθ2

∂ θi∂ θj

logf(X;θ)

1≤i,j≤p

Pour une famille exponentielle, si on utilise la paramétrisation canonique :

S(X;η) = T(X)−∇ηA(η) I(X;η) = ∇2ηA(η) =covη(T(X))

() Chap 2 : Vraisemblance, Estimation ponctuelle et Intervalle de Confiance18 / 45

(17)

Inégalité d’information de Cramér-Rao

Théorème

Soit M modèle statistique régulier, g fonction dérivable et

Tn=T(X1, . . . ,Xn) un estimateur sans biais de g(θ).

Cas θ scalaire : la borne de Cramer-Rao est définie par BCR(θ) =Ig0)

n(θ) et Vθ(Tn)≥BCR(θ) =g0(θ)2

In(θ) Cas θ vectoriel :

Vθ(Tn)≥J(g)(θ)>In(θ)−1J(g)(θ) avec J(g)(θ)= Jacobien de g évalué au point θ.

(18)

Efficacité d’un estimateur

La comparaison entre les matrices de covariances est au sens de l’ordre (partiel) matrices s.d.p :A,B s.d.p. A≤B ⇐⇒B−A s.d.p

Inégalité d’information = BCR(θ)est la meilleure variance possible pour un estimateur sans biais.

Un estimateurTn sans biais de g(θ) est un estimateurefficace si Vθ(g(θ)) =BCR(θ):

() Chap 2 : Vraisemblance, Estimation ponctuelle et Intervalle de Confiance20 / 45

(19)

Estimateur du maximum de vraisemblance

(20)

Estimateur du Maximum de Vraisemblance

SoitM un modèle paramétrique et x1, . . . ,xn un échantillon de vraisemblanceL(θ;x1, . . . ,xn) =∏ni=1f(xi;θ). Lorsqu’il existe, l’estimateur du maximum de vraisemblance est définie par

θˆnEMV = arg min

θ∈ΘL(θ;x1, . . . ,xn)

= arg min

θ∈ΘL(θ;x1, . . . ,xn)

Remarque

Les conditions suffisantes d’optimalité pour déterminerθˆnEMV sont :









∂L

∂ θ (x,θ)|

θ= ˆθnEMV =0

2L

∂ θ2 (x,θˆnEMV)≤0

L(x,θˆnEMV)≥L(x,θ),∀θ∈Θ.

() Chap 2 : Vraisemblance, Estimation ponctuelle et Intervalle de Confiance23 / 45

(21)

Exemples d’estimateurs d’EMV

Le cas Bernoulli Le cas Poisson

(22)

Propriétés de l’EMV

Sous les hypothèses du théorème de factorisation, θˆnEMVest fonction de toute statistique exhaustive.

Pour l’EMV, il y a des problèmes :

I Existence d’une solution au problème de maximisation

I Existence de plusieurs solutions et de minima locaux

I Numérique (pour l’optimisation)

Pour un modèle exponentiel de plein rang (avec la paramétrisation naturelle) etI(η)>0 pour toutη,L(θ;x1, . . . ,xn) est strictement concave et l’EMV est l’unique solution de

1 n

n

j=1

T(xj) =∇ηA( ˆηEMV)

() Chap 2 : Vraisemblance, Estimation ponctuelle et Intervalle de Confiance25 / 45

(23)

Comportement asymptotique des estimateurs

(24)

Convergence de l’EMV

Si le modèle paramétriqueM est régulier et si θ∈Θ est le vrai paramètre alors

θˆnEMV −→θ en probabilitéPθ.

Remarque

La régularité suppose que l’information de Fisher I(θ) existe et est définie positive. Une conséquence de I(θ)>0 est que le modèle est identifiable, i.ef(·;θ) =f(·,θ0) =⇒ θ=θ0, for all θ,θ0.

() Chap 2 : Vraisemblance, Estimation ponctuelle et Intervalle de Confiance28 / 45

(25)

Normalité asymptotique de l’EMV

Si le modèle paramétriqueM est régulier et si θ∈Θ est le vrai paramètre alors

√n

θˆnEMV−θ

N(0,I1(θ))

Remarque

√n est la vitesse de convergence de l’estimateur. De manière générale, la convergence des estimateurs paramétriques est "en 1n".

Un estimateur consistent θˆn est dit asymptotiquement normalsi il existern>0 tel que

rn θˆn−θ

N(0,J(θ)). J(θ) est la variance asymptotique.

(26)

Delta-Method

Soitθˆn, un estimateur asymptotiquement normal rn

θˆn−θ

N(0,J(θ)), etψ une fonction différentiable autour deθ, alors ψ( ˆθn)est asymptotiquement normal et

rn ψ

θˆn

−ψ(θ)

N

0,ψ0(θ)>J(θ)ψ0(θ)

Lemme de Slutsky : Si Yn Y etAnProba−→ A etBnProba−→ B, alors An+BnYn A+BY

Ces résultats sont utilisées pour obtenir la normalité asymptotique de statistique complexe (mais régulière) de l’échantillon.

() Chap 2 : Vraisemblance, Estimation ponctuelle et Intervalle de Confiance30 / 45

(27)

Intervalle de confiance

(28)

Intervalle de Confiance

On considËre un modËle d’Èchantillonnage paramÈtriqueX1, ...,Xn de taille n. Les variables alÈatoiresX1, ...,Xn sont indÈpendantes et de mÍme loi inconnueP, et elles sont à valeurs dansX (Rou Rd).

On suppose que la loiP appartient à une famille de probabilitÈ P={Pθ,θΘ}.

DÈfinition 3.1 (RÈgion de Confiance)

Soitx7→Λ(x)une application deXn à valeurs dans l’ensemble des borÈliens de g(Θ) telle que pour toutθΘ, on a

Pθ(g)Λ(X1, ...,Xn)) =1−α.

On dit que l’ensemble alÈatoireΛest une rÈgion de confiance de niveau(1−α).

Dans le cas oùg(Θ)RetΛest un intervalle, on parle d’un intervalle de confiance.

DÈfinition 3.2 (Intervalle de Confiance)

Pour α[01]donnÈ, on appelle intervalle de confiance pour le paramËtre θ (resp.g)), de niveau de confiance 1−α, un intervalle ICα qui a la probabilitÈ de 1α de contenir la vraie valeur de θ (resp.g)), i.e.,

P(θICα) =1−α(resp. P(g)ICα) =1α.)

() Chap 2 : Vraisemblance, Estimation ponctuelle et Intervalle de Confiance32 / 45

(29)

Intervalle de Confiance

DÈfinition 3.4 (Statistique asymptoptiquement libre)

On appelle statistique asymptotiquement libre pourθ, toute statistique dont sa loi asymptotique ne dÈpend pas deθ.

Exemple 3.1 SoitX1, ...,Xn un Èchantillon de loiN (µ,σ2). Notons X¯n=1n

n

i=1

Xi et Sn2=n11

n

i=1

(XiX¯n)2.

- Siσ est connu,

n( ¯Xn−µ)

σ est une statistique libre pour µ, de loiN (0,1).

- Siσ est inconnu

n( ¯Xn−µ)

Sn est une statistique libre pour µ, de loiTn1. - Siµ est connuni=1

X

i−µ σ

2

est une statistique libre pour σ, de loi χn2.

(30)

Construction pratique d’un IC

Exemple 3.2 X1, ...,Xn un Èchantillon de loiP(1λ).Tn=

n( ¯Xn−λ)

λ est une statistique asymptotiquement libre pourλ. En effet, par le thÈorËme central-limite Tn loi

−→

n→∞N (0,1).

Construction pratique d’un IC

SoitTn un estimateur du paramËtreθ. On chercheϕ1(Tn)etϕ2(Tn)de sorte que leurs lois ne dÈpendent pas deθ et

P(ϕ1(Tn) θ ϕ2(Tn)) =1α

Remarque Le choix d’une statistique libre revient à Èviter d’avoir les bornes de l’IC dÈpendantes deθ

() Chap 2 : Vraisemblance, Estimation ponctuelle et Intervalle de Confiance35 / 45

(31)

IC - EspÈrance d’une variable normale : σ connu

σ connu SoitX1, ...,Xn un Èchantillon de loiN (µ,σ2).

- PrenonsX¯n=1n

n i=1

Xi comme estimateur deµ.

- On utilise le fait que

n( ¯Xn−µ)

σ est une statistique libre pourµ, de loi N (0,1).

- L’intervalle de probabilitÈ deX¯nà 1α est :

−uα

2

n( ¯Xn−µ)

σ uα

2

µ−uα 2

σ

n X¯n µ+uα 2

σ n uα

2 est telle queφ(uα

2) =P(N(0,1)uα

2) =1α2. d’où l’intervalle de confiance :

x¯nuα 2

σ

n µ x¯n+uα 2

σ n - Application numÈrique : si(1α) =0,95, on auα

2 =1,96. L’intervalle de confiance de niveau 95%pour µ est

(32)

IC - EspÈrance d’une variable normale : σ inconnu

On utilise le fait queTn1=

n( ¯Xn−µ)

Sn suit une loi de Student à (n−1) degrÈs de libertÈ.

L’intervalle de probabilitÈ pourTn1:

−t(n1),α

2

n( ¯Xnµ) Sn

t(n1),α

2

d’où l’intervalle de confiance : x¯nt(n1),α 2

s

nµ¯xn+t(n1),α 2

s n

Remarque Si la dÈfinitionSn2=n1ni=1(XiX¯n)2 alors l’intervalle de confiance devient :

¯xnt(n1),α 2

s

n1µ¯xn+t(n1),α 2

s

n1 Exemple 3.3 On prend, par exempleα=0,05, etn=25, on a t(n1),α

2 =2,064 et l’intervalle de confiance de niveau de confiance 95%pour µ est :

x¯n2,064

25 s25,¯xn+2,064

25 s25

Remarque Le TCL a pour consÈquence que les intervalles prÈcÈdents sont valables pour estimer µ d’une loi quelconque quandnest assez grand.

() Chap 2 : Vraisemblance, Estimation ponctuelle et Intervalle de Confiance37 / 45

(33)

IC - Variance d’une variable normale

µconnu soitUˆn2=1nni=1(Xiµ)2. on utilise le fait que nUˆn2

σ2 suit une loi deχn2 comme somme dencarrÈs deN (0,1)indÈpendantes.

Soitk1 etk2, les bornes de l’intervalle de probabilitÈ d’un χn2 : P(k1nUˆn2

σ2 k2) =1α d’où l’intervalle de confiance :

u2n k2

σ2u2n k1

µ inconnu On utiliseSn2=n11

n i=1

(XiX¯n)2, et on sait que (n1)Sn2

σ2 suit une loiχn21, soitb1etb2 les bornes de l’intervalle de probabilitÈ :

P(b1(n1)Sn2

σ2 b2) =1α d’où l’intervalle de confiance :

(34)

Intervalle de Confiance : Exemple

Exemple 3.4 SoitX1, ...,Xn un Èchantillon de loi uniformeU([0,θ]).

La vraisemblance associÈ à l’Èchantillon est dÈfinie par Ln(x,θ) = Πni=11

θ1[0](xi)

DÈterminons l’EMV :Ln(x,θ)est maximum enθ ssiΠni=11[0[(xi) =1.

Autrement dit∀i=1, ...,n θxi, donc, sup

1in

xiθ.D’où l’EMV : θˆn= sup

1in

Xi

Cherchons une statistique libre pourθ (à partir deθˆn). D’abord calculons la loi deθˆn,∀x[0,θ],

Fθˆn(x) = P( ˆθnx)

= (x θ)n VÈrifions queTn=θˆn

θ est une statistique libre pour θ. En effet, ∀x[0,1], on a

FTn(x) = P(Tnx) =P( ˆθnθx)

= xn(bien indÈpendant deθ)

() Chap 2 : Vraisemblance, Estimation ponctuelle et Intervalle de Confiance39 / 45

(35)

Intervalle de Confiance : Exemple

IC MÈthode 1: DÈterminons unϕ1( ˆθn)etϕ2( ˆθn)telle que P

ϕ1( ˆθn)θϕ2( ˆθn)

=1α (1)

A partir de(1), il faut construire autour deθ, l’estimateurTn

P 1

ϕ2( ˆθn) 1 θ 1

ϕ1( ˆθn)

= 1α P

θˆn

ϕ2( ˆθn)Tn θˆn

ϕ1( ˆθn)

!

= 1α

Comme on connait la loi de la statistique libreTn, on cherche donc un a := θˆn

ϕ2( ˆθn) etb := θˆn

ϕ1( ˆθn) tels que

P(aTnb) = 1−α FTn(b)−FTn(a) = 1−α bn−an = 1−α

Il y a une infinitÈ deaetbpossibles. On choisit aetbtels que l’intervalle [a,b]soit le plus court possible. Soitb=1 et donca= 1.

(36)

Intervalle de Confiance : Exemple

Soitϕ1( ˆθn) = ˆθn et ϕ1( ˆθn) =α1nθˆn Nous avons donc obtenu un intervalle

de confiance : h

θˆn;α

1 nθˆn

i

IC MÈthode 2: On peut partir directement deTn, et l’on cherche una etbtel que

P(aTnb) = 1−α FTn(b)−FTn(a) = 1−α bn−an = 1−α

On choisit lesaetbtels que [a,b]soit l’intervalle le plus court possible.

Puis on remonte le raisonnement pour arriver à un intervalle de confiance (voir exemple sur les espÈrances/variances normales).

() Chap 2 : Vraisemblance, Estimation ponctuelle et Intervalle de Confiance41 / 45

(37)

Intervalle de Confiance Asymptotique

MÈthode ModËle rÈgulier, c’est-à-dire l’existence de l’information de Fisher.

- On construit l’intervalle asymptotique en utilisant l’estimateur du maximum de vraisemblanceθˆnde θ.

- On sait queθˆn est asymtotiquement normal, i.e. :

n( ˆθn−θ)loi

−→

n→∞N (0, 1 I)).

- Autrement dit :

pn I)( ˆθnθ)loi

n−→→∞N (0,1).

P

−uα

2

q

n I( ˆθn)( ˆθnθ)uα

2

= 1α d’oùl’intervalle de confiance asymptÙtique :

θˆn uα 2

q n I( ˆ)

,θˆn+ uα 2

q n I( ˆ )

.

(38)

Intervalle de Confiance Asymptotique : Exemple

Remarque On a mentionnÈ l’EMV car il est asymptÙtiquement normal, donc il converge en loi vers une loi connue (ici la loi normale).

Exemple 3.5 SoitX1, ...,Xn un Èchantillon de loi uniformeU([0,θ]).

L’Estimateur de Maximum de Vraisemblance :θˆn= sup

1in

Xi.

SoitTn:=n 1θˆn

θ

,Tn est une statistique asymptÙtiquement libre pour θ, en effet ;

FTn(x) = P(Tnx)

= P

θˆnθ(1x n)n

= 1−(1x n)n et lim

n→∞FTn(x) =1ex. Donc,TnT, oùT suit une loi exponentielle Exp(1).

() Chap 2 : Vraisemblance, Estimation ponctuelle et Intervalle de Confiance44 / 45

(39)

Intervalle de Confiance Asymptotique : Exemple

On cherche un intervalle de la forme[ ˆθn;b]tel que pour un α donnÈ on ait P( ˆθnθb) =1−α.

P( ˆθnθb) = P 0Tnn 1θˆn

b

!!

n→∞ FT n(1θˆn

b)

!

=1−α

d’oùb= θˆn

1n1FT−1(1−α) = θˆn

11nlogα On a donc

IC=

"

θˆn; θˆn

11nlogα

#

Références

Documents relatifs

La comparaison entre les matrices de covariances est au sens de l'ordre (partiel) matrices s.d.p : A, B s.d.p.. Comportement asymptotique

Un recensement des formes claires et sombres a été effectué le long de cinquante-quatre transects, de la surface jusqu’au fond du lagon.. Nombre

Application : On e¤ectue deux sondages aléatoires indépendants, l’un auprès de la population masculine et l’autre auprès de la population féminine pour déterminer la proportion

Dans la suite, on considère l’exemple suivant : une urne contient des boules vertes et des boules rouges dont on ignore le nombre et la proportion.. On effectue un tirage dans

Le

[r]

Sinon, PGCD (a ; b) est égal au produit des facteurs premiers communs au deux nombres, chacun étant affecté du plus petit exposant avec lequel il figure dans leurs

Dans cette partie, on suppose que, parmi les personnes sondées qui ont accepté de répondre à la question posée, 29 % affirment qu'elles sont favorables au projet.. L'institut de