• Aucun résultat trouvé

Statistique inf´erentielle Estimation

N/A
N/A
Protected

Academic year: 2022

Partager "Statistique inf´erentielle Estimation"

Copied!
39
0
0

Texte intégral

(1)

Estimation

A. Godichon-Baggioni

(2)

O BJECTIFS

On dispose de n donn´ees x 1 , . . . , x n qui sont des mesures d’une variable quantitative, et plus pr´ecis´ement des r´ealisations de variables al´eatoires ind´ependantes et identiquement

distribu´ees X 1 , . . . , X n . Objectifs :

I Estimer une caract´eristique θ de X 1 (moyenne, variance,...) I Estimer un param`etre θ de X 1 si cette variable est

param´etr´ee (loi de Bernoulli, normale, exponentielle,...) Exemples :

I Lancer de pi`ece : On s’int´eresse `a l’estimation de θ = E [X 1 ].

I Loi exponentielle : On s’int´eresse `a l’estimation du

param`etre θ = ( E [X 1 ]) −1 .

(3)

I. D´efinitions

(4)

S TATISTIQUE ET ESTIMATEUR

Dans ce qui suit, on consid`ere un ´echantillon X = ( X 1 , . . . , X n ) d´ependant d’un param`etre θ ∈ Θ , o `u Θ ⊂ R.

D´efinition

Une statistique T ( X ) est une fonction mesurable de l’´echantillon X ne d´ependant pas de θ (mais d´ependant ´eventuellement de param`etres connus). Un estimateur de θ est une statistique θ ˆ = θ ( X ) destin´ee `a approcher θ.

Exemple : Lancer de pi`ece

Attention ! Ne pas confondre estimateur et estimation !

Notation : Dans ce qui suit, on consid`ere θ ˆ n un estimateur de θ .

(5)

E RREUR QUADRATIQUE MOYENNE

D´efinition

On suppose que θ est `a valeurs dans Θ ⊂ R. L’erreur quadratique moyenne (ou risque quadratique) de l’estimateur θ ˆ n est d´efinie pour tout θ ∈ Θ par

EQM

θ ˆ n , θ

= E

θ ˆ n − θ 2 .

Remarquons que grˆace `a l’in´egalit´e de Markov, pour tout c > 0,

P h

θ ˆ n − θ ≥ c i

≤ EQM θ ˆ n , θ

c 2 .

(6)

B IAIS D ’ UN ESTIMATEUR

D´efinition

On appelle biais d’un estimateur θ ˆ n de θ la quantit´e B

θ ˆ n , θ

= E h θ ˆ n i

− θ.

1. S’il est nul, on dit que l’estimateur est sans biais ou non biais´e 2. Si

B θ ˆ n , θ

− −−−− →

n→+∞ 0,

on dit que l’estimateur est asymptotiquement sans biais.

Exemple : lancer de pi`ece. L’estimateur θ ˆ n est sans biais.

(7)

D ´ ECOMPOSITION B AIS -V ARIANCE

Proposition

Soit θ ˆ n un estimateur de θ , on a

EQM

θ ˆ n , θ

= B θ ˆ n , θ 2

+ V h θ ˆ n i

.

Exemple : lancer de pi`ece Comme θ ˆ n est un estimateur sans biais de θ , on a

EQM

θ ˆ n , θ

= V h θ ˆ n i

= θ( 1 − θ)

n .

(8)

C ONVERGENCE , CONSISTANCE ET NORMALIT E ´

ASYMPTOTIQUE D´efinition

On dit que l’estimateur θ ˆ n est 1. convergent ou consistant si

θ ˆ n − −−−− P

n→+∞ θ,

2. fortement consistant si

θ ˆ n − −−−− p.s

n→+∞ θ,

3. asymptotiquement normal si il existe σ 2 > 0 tel que

√ n

θ ˆ n − θ L

− −−−− →

n→+∞ N 0 , σ 2

.

(9)

II. Estimation de la moyenne et de la

variance

(10)

E STIMATION DE LA MOYENNE

Soient X 1 , . . . , X n des variables al´eatoires ind´ependantes et identiquement distribu´ees. Un estimateur naturel de la moyenne µ = E [ X 1 ] est donc

X n = 1 n

n

X

i=1

X i .

Proposition

1. X n est un estimateur sans biais et (fortement) consistant de µ . 2. Si σ 2 = V [ X 1 ] < +∞, alors X n est asymptotiquement normal

et

√ n X n − µ L

− −−−− →

n→+∞ N 0 , σ 2 EQM X n , µ

= σ 2

n .

(11)

E STIMATION DE LA MOYENNE

0 200 400 600 800 1000

0.350.400.450.500.550.60

50 100 200 500 1000

0.400.450.500.550.60

F IGURE – Evolution de x

n

par rapport `a n pour 4 ´echantillons (`a gauche) et boxplots pour les x

n

obtenus pour

n = 50, 100, 200, 500, 1000 `a l’aide de 4000 ´echantillons (`a droite).

(12)

E STIMATION DE LA VARIANCE

Lorsque µ est connu, un estimateur naturel de la variance est V ˆ n = 1

n

n

X

i=1

( X i − µ) 2

V ˆ n est sans biais et fortement consistant.

Si µ est inconnue, on a la variance empirique ˆ

σ n 2 = 1 n

n

X

i=1

X i − X n

2

= 1 n

n

X

i=1

X i 2 − X 2 n .

(13)

E STIMATEUR SANS BIAIS DE LA VARIANCE

Proposition

ˆ

σ n 2 est un estimateur biaisi´e de σ 2 mais asymptotiquement sans biais.

Plus pr´ecis´ement, on a E

ˆ σ 2 n

= n − 1 n σ 2 .

D´efinition

L’estimateur sans biais de la variance S 2 n est d´efini par

S 2 n = n

n − 1 σ ˆ 2 n = 1 n − 1

n

X

i=1

X i − X n

2

= 1

n − 1

n

X

i=1

X 2 i − nX 2 n

!

.

(14)

E STIMATEUR SANS BIAIS DE LA VARIANCE

50 100 200 500 1000

0.060.070.080.090.100.11

50 100 200 500 1000

0.060.070.080.090.100.11

F IGURE – Boxplots pour l’estimateur non biais´e (`a gauche) et biais´e (`a

droite)

(15)

C ONVERGENCE

Proposition

Les estimateurs σ ˆ n 2 et S 2 n sont consistants.

Proposition

Si X 1 admet un moment d’ordre 4, alors σ ˆ 2 n et S 2 n sont asymptotiquement normaux, et on a

√ n σ ˆ 2 n − σ 2 L

− −−−− →

n→+∞ N 0 , τ 4 − σ 4

√ n S 2 n − σ 2 L

− −−−− →

n→+∞ N 0 , τ 4 − σ 4 o `u

τ 4 = E h

( X 1 − µ) 4 i

.

(16)

III. M´ethode des moments

(17)

M ´ ETHODE DES MOMENTS Proposition

Soit Θ un intervalle ouvert de R et θ ∈ Θ. Soit ϕ un C 1 -diff´eomorphisme de Θ dans ϕ (Θ). Soit ϕ ˆ n un estimateur

consistant de ϕ(θ), alors θ ˆ n = ϕ −1 ( ˆ ϕ n ) est un estimateur consistant de θ, i.e

θ ˆ n − −−−− P

n→+∞ θ.

De plus, si ϕ ˆ n est un estimateur asymptotiquement normal de ϕ(θ), i.e si il existe σ 2 > 0 tel que

√ n ( ˆ ϕ n − ϕ(θ)) − −−−− L

n→+∞ N 0 , σ 2 ,

et si ϕ 0 (θ) 6= 0, alors θ ˆ n est un estimateur asymptotiquement normal de θ et

√ n

θ ˆ n − θ L

− −−−− →

n→+∞ N 0, σ 2

0 (θ)) 2

!

.

(18)

M ´ ETHODE DES MOMENTS

La m´ethode des moments consiste `a trouver un C 1 -diff´eomorphisme ϕ et un moment k tel que E

X k 1

= ϕ(θ).

Comme un estimateur de m k est donn´e par m ˆ n,k = 1

n

n

X

i=1

X k i

on obtient l’estimateur

θ ˆ n = ϕ −1 ( ˆ m n,k )

(19)

E XEMPLES

Exemple : la loi uniforme. On consid`ere des variables al´eatoires i.i.d X 1 , . . . , X n suivant une loi uniforme sur

0, θ 2 , avec θ > 0, i.e de densit´e f θ d´efinie pour tout x ∈ R par

f θ (x) = 1

θ 2 1 [0,θ

2

] (x).

Exemple : la loi exponentielle. Soient X 1 , . . . , X n des variables al´eatoires i.i.d suivant une loi exponentielle de param`etre θ > 0, i.e de densit´e f θ d´efinie pour tout x ∈ R,

f θ ( x ) = θ exp (−θ x ) 1 R

+

( x ).

(20)

R EMARQUES

Remarque : Pour ´eviter les erreurs, il est plus judicieux (et cela revient `a peu pr`es au mˆeme) d’´ecrire θ comme une fonction de E

X k .

Remarque : Attention ! Il peut arriver qu’une variable al´eatoire n’admette pas de moment d’ordre 1. Il faut alors essayer d’ˆetre malin !

Exemple : Soit θ > 0, on consid`ere une variable al´eatoire X de densit´e d´efinie pour tout x ∈ R par

f θ (x) = θ

x 2 1 x≥θ .

(21)

F ONCTION G EN ´ ERATRICE ´

D´efinition (Fonction g´en´eratrice)

Soit X une variable al´eatoire, on appelle fonction g´en´eratrice G X de X la fonction d´efinie par

G X (t) = E e tX

.

Attention ! La fonction g´en´eratrice n’est pas n´ecessairement

d´efinie, et encore moins pour tout t.

(22)

F ONCTION G EN ´ ERATRICE ´

Th´eor`eme

On suppose que la variable al´eatoire X admet des moments de tout ordre, i.e pour tout k ∈ N E

X k

< +∞ , et que la s´erie P

k≥0 t

k

E [ X

k

]

k!

admet un rayon de convergence R. Alors pour tout | t | < R on a G X (t) = X

k≥0

t k E X k k ! . En particulier, pour tout k ∈ N, on a

G (k) X (0) = E h X k i

.

Exmple : la loi g´eom´etrique. Soit X ∼ G( p ) avec p ∈ ( 0 , 1 ) . Alors pour tout t < − log( 1 − p ) ,

G X (t) = pe t

1 − ( 1 − p ) e t .

(23)

IV. M´ethode du Maximum de

Vraisemblance

(24)

N OTATIONS

Dans ce qui suit, on note X = (X 1 , . . . , X n ) o `u les X i sont i.i.d.

On note f θ la densit´e de X 1 .

Rappel : Dans le cas discret, on a pour tout x ∈ R,

f θ (x) = P [X 1 = x] .

(25)

( LOG )- VRAISEMBLANCE

D´efinition (Vraisemblance et log-vraisemblance)

La vraisemblance de X est d´efinie pour tout θ ∈ Θ par L X (θ) =

n

Y

i=1

f θ ( X i ) .

La log-vraisemblance de X est d´efinie pour tout θ ∈ Θ par

l X (θ) = log ( L X (θ)) = log

n

Y

i=1

f θ ( X i )

! .

Attention ! La (log-)vraisemblance est al´eatoire.

(26)

E XEMPLES : CAS DISCRET

Exemple 1 : loi de Bernoulli. On consid`ere X = (X 1 , . . . , X n ) o `u les X i sont i.i.d et X 1 ∼ B(θ) avec θ ∈ (0, 1).

Exemple 2 : loi de Poisson. On consid`ere X = (X 1 , . . . , X n ) o `u

les X i sont i.i.d et X 1 suit une loi de Poisson de param`etre θ > 0.

(27)

E XEMPLES : CAS CONTINU

Exemple 1 : loi exponentielle. On consid`ere X = ( X 1 , . . . , X n ) o `u les X i sont i.i.d et X 1 ∼ E (θ) avec θ > 0.

Exemple 2 : loi normale. On consid`ere X = ( X 1 , . . . , X n ) o `u les X i sont i.i.d et X 1 ∼ N µ, σ 2

avec µ ∈ R.

Exemple 3 : On consid`ere X = ( X 1 , . . . , X n ) o `u les X i sont i.i.d et X 1 admet pour densit´e f θ d´efinie pour tout x ∈ R par

f θ ( x ) = θ x 2 1 x≥θ

avec θ > 0.

(28)

R EMARQUES

Cas discret La r´ealisation de la vraisemblance est la probabilit´e de d’obtenir cette r´ealisation de l’´echantillon.

Cas continue La r´ealisation de la vraisemblance est la densit´e de X en la r´ealisation de l’´echantillon.

Objectifs : Maximiser cette probabilit´e (ou densit´e).

(29)

E STIMATEUR DU MAXIMUM DE VRAISEMBLANCE

D´efinition (Estimateur du maximum de vraisemblance (EMV))

Le maximum de vraisemblance, si il existe, est un ´el´ement θ ˆ n de Θ qui v´erifie

L X

θ ˆ n

= sup

θ∈Θ L X (θ).

De mani`ere ´equivalente, l’estimateur du maximum de vraisemblance, si il existe, v´erifie

l X

θ ˆ n

= sup

θ∈Θ

l X (θ).

(30)

R EMARQUES

Attention ! L’EMV est g´en´eralement al´eatoire.

Attention ! Ni l’existence ni l’unicit´e de l’EMV ne sont assur´ees.

Remarque : A noter que si θ ˆ n est un EMV de θ , alors ϕ θ ˆ n

est un EMV de ϕ(θ) .

Remarque : On notera ´egalement θ ˆ n = arg max

θ∈Θ L X (θ) ou θ ˆ n = arg max

θ∈Θ l X (θ)

(31)

E XEMPLES : CAS DISCRET

Exemple 1 : loi de Bernoulli. On consid`ere X = (X 1 , . . . , X n ) o `u les X i sont i.i.d et X 1 ∼ B(θ) avec θ ∈ (0, 1).

Exemple 2 : loi de Poisson. On consid`ere X = (X 1 , . . . , X n ) o `u

les X i sont i.i.d et X 1 suit une loi de Poisson de param`etre θ > 0.

(32)

E XEMPLES : CAS CONTINU

Exemple 1 : loi exponentielle. On consid`ere X = ( X 1 , . . . , X n ) o `u les X i sont i.i.d et X 1 ∼ E (θ) avec θ > 0.

Exemple 2 : loi normale. On consid`ere X = ( X 1 , . . . , X n ) o `u les X i sont i.i.d et X 1 ∼ N µ, σ 2

avec µ ∈ R.

Exemple 3 : On consid`ere X = ( X 1 , . . . , X n ) o `u les X i sont i.i.d et X 1 admet pour densit´e f θ d´efinie pour tout x ∈ R par

f θ ( x ) = θ x 2 1 x≥θ

avec θ > 0.

(33)

C OMMENT TROUVER L ’EMV

Soit l’EMV peut ˆetre donn´e ”explicitement” par la

vraisemblance, soit il est souvent plus facile de maximiser la log-vraisemblance. Pour cela, voici quelques options

possibles :

I Dresser le tableau de variations de la log vraisemblance I Chercher les z´eros de la d´eriv´ee, i.e r´esoudre

l 0 X (θ) = 0 .

I V´erifier qu’il(s) maximise(nt) la log-vraisemblance (´etude

de la concavit´e, ...)

(34)

U N CAS D ’ ´ ETUDE

Exemple : Soit X 1 , . . . , X n des variables al´eatoires i.i.d suivant une loi uniforme sur [ 0 , θ] , avec θ > 0.

I M´ethode des moments ?

I M´ethode du maximum de vraisemblance ?

(35)

O BJECTIFS

On s’int´eresse `a l’estimation d’un param`etre θ ∈ Θ d’une variable al´eatoire X, avec Θ un intervalle ouvert de R. Les objectifs sont donc :

I Comparer diff´erents estimateurs de θ.

I Savoir si on peut parler d’estimateur optimal.

(36)

V. Comparaison d’estimateurs

(37)

C OMPARAISON DES ERREURS QUADRATIQUES MOYENNES

On rappelle qu’une fac¸on de quantifier la qualit´e d’un estimateur θ ˆ n de θ est de consid´erer son risque quadratique

EQM

θ ˆ n , θ

= E

θ ˆ n − θ 2 .

On consid`ere que θ ˆ n est un meilleur estimateur que θ ˜ n si

∀θ ∈ Θ, EQM θ ˆ n , θ

≤ EQM θ ˜ n , θ

.

(38)

B IAIS D ’ UN ESTIMATEUR

On donne trop souvent trop d’importance au biais d’un estimateur ! D´ebiaiser un estimateur ne donne pas forc´ement de meilleurs r´esultats !

Exemple : Soit θ > 0 et X ∼ U ([0, θ]). Comparer les erreurs quadratiques moyennes des estimateurs suivants :

θ ˆ n = X (n)

θ ˜ n = n + 1 n X (n)

θ α,n = α X (n)

avec α > 0 choisi judicieusement.

(39)

A PPROCHE ASYMPTOTIQUE

Le plus souvent, on dispose d’estimateurs θ ˆ n , θ ˜ n

asymptotiquement normaux, i.e il existe σ 1 2 et σ 2 2 telles que

√ n

θ ˆ n − θ L

− −−−− →

n→+∞ N 0 , σ 2 1 ,

√ n

θ ˜ n − θ L

− −−−− →

n→+∞ N 0 , σ 2 2

.

Si σ 1 2 ≤ σ 2 2 , on choisira alors l’estimateur θ ˆ n .

Références

Documents relatifs

1 D´ eterminer la taille d’´ echantillon requise pour estimer, avec un niveau de confiance de 99% la dur´ ee de bon fonctionnement de sorte que la marge d’erreur dans l’estimation

On note Pic(S) le groupe de Picard de S, c’est à dire le groupe des classes d’isomorphisme de fibrés en droites algébriques sur S.. Supposons que S

(7) On suppose de plus qu’ ` a chaque mesure la valeur est une r´ ealisation d’une variable al´ eatoire Gaussienne de variance inconnue.. Construire l’intervalle de confiance

On dit qu’une machine (ou langage) est Turing complet s’il permet de calculer toutes les fonctions calculables - Java, C, Caml sont Turing complets.. C’est bien la calculabilit´

R´ evision du cours de BCPST1 ` a destination des BCPST2... R´ evision des vacances d’´

Combien de copies le professeur doit-il corriger s’il veut situer la moyenne dans un intervalle de confiance d’amplitude 2 avec un risque 5% ?.. Exercice

I Les hypoth`eses nulles et alternatives : disposant d’un mod`ele probabiliste, on souhaite v´erifier une hypoth`ese sur ce mod`ele, appel´ee hypoth`ese nulle H0 et on introduit

Les quatre cas ci-dessous consid` erent les attentes entre deux commutations d’une LED soit par fonction sleep (d´ elai pr´ ed´ efini), soit par un appel ` a une fonction par