Statistique inf´erentielle Estimation

(1)

Estimation

A. Godichon-Baggioni

(2)

O BJECTIFS

On dispose de n données x 1 , . . . , x n qui sont des mesures d’une variable quantitative, et plus précisément des réalisations de variables aléatoires indépendantes et identiquement

distribu´ees X 1 , . . . , X n . Objectifs :

I Estimer une caract´eristique θ de X 1 (moyenne, variance,...) I Estimer un param`etre θ de X 1 si cette variable est

param´etr´ee (loi de Bernoulli, normale, exponentielle,...) Exemples :

I Lancer de pièce : On s’intéresse à l’estimation de θ = E [X 1 ].

I Loi exponentielle : On s’int´eresse `a l’estimation du

param`etre θ = ( E [X 1 ]) ⁻¹ .

(3)

I. D´efinitions

(4)

S TATISTIQUE ET ESTIMATEUR

Dans ce qui suit, on considère un échantillon X = ( X 1 , . . . , X n ) dépendant d’un paramètre θ ∈ Θ , o ù Θ ⊂ R.

D´efinition

Une statistique T ( X ) est une fonction mesurable de l’échantillon X ne dépendant pas de θ (mais dépendant éventuellement de paramètres connus). Un estimateur de θ est une statistique θ ˆ = θ ( X ) destinée à approcher θ.

Exemple : Lancer de pi`ece

Attention ! Ne pas confondre estimateur et estimation !

Notation : Dans ce qui suit, on consid`ere θ ˆ _n un estimateur de θ .

(5)

E RREUR QUADRATIQUE MOYENNE

D´efinition

On suppose que θ est `a valeurs dans Θ ⊂ R. L’erreur quadratique moyenne (ou risque quadratique) de l’estimateur θ ˆ _n est d´efinie pour tout θ ∈ Θ par

EQM

θ ˆ _n , θ

= E

θ ˆ _n − θ 2 .

Remarquons que grâce à l’inégalité de Markov, pour tout c > 0,

P h

θ ˆ _n − θ ≥ c i

≤ EQM θ ˆ _n , θ

c ² .

(6)

B IAIS D ’ UN ESTIMATEUR

D´efinition

On appelle biais d’un estimateur θ ˆ _n de θ la quantit´e B

θ ˆ _n , θ

= E h θ ˆ _n i

− θ.

1. S’il est nul, on dit que l’estimateur est sans biais ou non biais´e 2. Si

B θ ˆ _n , θ

− −−−− →

n→+∞ 0,

on dit que l’estimateur est asymptotiquement sans biais.

Exemple : lancer de pi`ece. L’estimateur θ ˆ _n est sans biais.

(7)

D ´ ECOMPOSITION B AIS -V ARIANCE

Proposition

Soit θ ˆ _n un estimateur de θ , on a

EQM

θ ˆ _n , θ

= B θ ˆ _n , θ 2

+ V h θ ˆ _n i

.

Exemple : lancer de pi`ece Comme θ ˆ _n est un estimateur sans biais de θ , on a

EQM

θ ˆ _n , θ

= V h θ ˆ _n i

= θ( 1 − θ)

n .

(8)

C ONVERGENCE , CONSISTANCE ET NORMALIT E ´

ASYMPTOTIQUE D´efinition

On dit que l’estimateur θ ˆ _n est 1. convergent ou consistant si

θ ˆ _n − −−−− ^P →

n→+∞ θ,

2. fortement consistant si

θ ˆ _n − −−−− ^p.s →

n→+∞ θ,

3. asymptotiquement normal si il existe σ ² > 0 tel que

√ n

θ ˆ _n − θ _L

− −−−− →

n→+∞ N 0 , σ ²

.

(9)

II. Estimation de la moyenne et de la

variance

(10)

E STIMATION DE LA MOYENNE

Soient X 1 , . . . , X n des variables aléatoires indépendantes et identiquement distribuées. Un estimateur naturel de la moyenne µ = E [ X 1 ] est donc

X n = 1 n

n

X

i=1

X i .

Proposition

1. X n est un estimateur sans biais et (fortement) consistant de µ . 2. Si σ ² = V [ X 1 ] < +∞, alors X n est asymptotiquement normal

et

√ n X n − µ L

− −−−− →

n→+∞ N 0 , σ ² EQM X n , µ

= σ ²

n .

(11)

E STIMATION DE LA MOYENNE

0 200 400 600 800 1000

0.350.400.450.500.550.60

●●

●

●●

●

●●

●

50 100 200 500 1000

0.400.450.500.550.60

F IGURE – Evolution de x

n

par rapport à n pour 4 échantillons (à gauche) et boxplots pour les x

n

obtenus pour

n = 50, 100, 200, 500, 1000 à l’aide de 4000 échantillons (à droite).

(12)

E STIMATION DE LA VARIANCE

Lorsque µ est connu, un estimateur naturel de la variance est V ˆ n = 1

n

X

i=1

( X i − µ) ²

V ˆ n est sans biais et fortement consistant.

Si µ est inconnue, on a la variance empirique ˆ

σ _n ² = 1 n

n

X

i=1

X i − X n

2 = 1 n

n

X

i=1

X _i ² − X ² _n .

(13)

E STIMATEUR SANS BIAIS DE LA VARIANCE

Proposition

ˆ

σ _n ² est un estimateur biaisi´e de σ ² mais asymptotiquement sans biais.

Plus pr´ecis´ement, on a E

ˆ σ ² _n

= n − 1 n σ ² .

D´efinition

L’estimateur sans biais de la variance S ² _n est d´efini par

S ² _n = n

n − 1 σ ˆ ² _n = 1 n − 1

n

X

i=1

X i − X n

2 = 1

n − 1

n

X

i=1

X ² _i − nX ² _n

!

.

(14)

E STIMATEUR SANS BIAIS DE LA VARIANCE

●

●●

●

50 100 200 500 1000

0.060.070.080.090.100.11

●

● ●

●●

●

50 100 200 500 1000

0.060.070.080.090.100.11

F IGURE – Boxplots pour l’estimateur non biaisé (à gauche) et biaisé (à

droite)

(15)

C ONVERGENCE

Proposition

Les estimateurs σ ˆ _n ² et S ² _n sont consistants.

Proposition

Si X 1 admet un moment d’ordre 4, alors σ ˆ ² _n et S ² _n sont asymptotiquement normaux, et on a

√ n σ ˆ ² _n − σ ² L

− −−−− →

n→+∞ N 0 , τ ⁴ − σ ⁴

√ n S ² _n − σ ² L

− −−−− →

n→+∞ N 0 , τ ⁴ − σ ⁴ o `u

τ ⁴ = E h

( X 1 − µ) ⁴ i

.

(16)

III. M´ethode des moments

(17)

M ´ ETHODE DES MOMENTS Proposition

Soit Θ un intervalle ouvert de R et θ ∈ Θ. Soit ϕ un C ¹ -diff´eomorphisme de Θ dans ϕ (Θ). Soit ϕ ˆ _n un estimateur

consistant de ϕ(θ), alors θ ˆ _n = ϕ ⁻¹ ( ˆ ϕ _n ) est un estimateur consistant de θ, i.e

θ ˆ _n − −−−− ^P →

n→+∞ θ.

De plus, si ϕ ˆ _n est un estimateur asymptotiquement normal de ϕ(θ), i.e si il existe σ ² > 0 tel que

√ n ( ˆ ϕ _n − ϕ(θ)) − −−−− ^L →

n→+∞ N 0 , σ ² ,

et si ϕ ⁰ (θ) 6= 0, alors θ ˆ _n est un estimateur asymptotiquement normal de θ et

√ n

θ ˆ _n − θ _L

− −−−− →

n→+∞ N 0, σ ²

(ϕ ⁰ (θ)) ²

!

.

(18)

M ´ ETHODE DES MOMENTS

La méthode des moments consiste à trouver un C ¹ -difféomorphisme ϕ et un moment k tel que E

X ^k ₁

= ϕ(θ).

Comme un estimateur de m k est donn´e par m ˆ n,k = 1

n

X

i=1

X ^k _i

on obtient l’estimateur

θ ˆ _n = ϕ ⁻¹ ( ˆ m n,k )

(19)

E XEMPLES

Exemple : la loi uniforme. On consid`ere des variables al´eatoires i.i.d X 1 , . . . , X n suivant une loi uniforme sur

0, θ ² , avec θ > 0, i.e de densit´e f θ d´efinie pour tout x ∈ R par

f θ (x) = 1

θ ² 1 [0,θ

²

] (x).

Exemple : la loi exponentielle. Soient X 1 , . . . , X n des variables aléatoires i.i.d suivant une loi exponentielle de paramètre θ > 0, i.e de densité f θ définie pour tout x ∈ R,

f θ ( x ) = θ exp (−θ x ) 1 R

+

( x ).

(20)

R EMARQUES

Remarque : Pour éviter les erreurs, il est plus judicieux (et cela revient à peu près au même) d’écrire θ comme une fonction de E

X ^k .

Remarque : Attention ! Il peut arriver qu’une variable al´eatoire n’admette pas de moment d’ordre 1. Il faut alors essayer d’ˆetre malin !

Exemple : Soit θ > 0, on considère une variable aléatoire X de densité définie pour tout x ∈ R par

f θ (x) = θ

x ² 1 x≥θ .

(21)

F ONCTION G EN ´ ERATRICE ´

Définition (Fonction génératrice)

Soit X une variable aléatoire, on appelle fonction génératrice G X de X la fonction définie par

G X (t) = E e ^tX

.

Attention ! La fonction génératrice n’est pas nécessairement

d´efinie, et encore moins pour tout t.

(22)

F ONCTION G EN ´ ERATRICE ´

Th´eor`eme

On suppose que la variable al´eatoire X admet des moments de tout ordre, i.e pour tout k ∈ N E

X ^k

< +∞ , et que la s´erie P

k≥0 t

^k

E [ X

^k

]

k!

admet un rayon de convergence R. Alors pour tout | t | < R on a G X (t) = X

k≥0

t ^k E X ^k k ! . En particulier, pour tout k ∈ N, on a

G ^(k) _X (0) = E h X ^k i

.

Exmple : la loi g´eom´etrique. Soit X ∼ G( p ) avec p ∈ ( 0 , 1 ) . Alors pour tout t < − log( 1 − p ) ,

G X (t) = pe ^t

1 − ( 1 − p ) e ^t .

(23)

IV. M´ethode du Maximum de

Vraisemblance

(24)

N OTATIONS

Dans ce qui suit, on note X = (X 1 , . . . , X n ) o `u les X i sont i.i.d.

On note f θ la densit´e de X 1 .

Rappel : Dans le cas discret, on a pour tout x ∈ R,

f θ (x) = P [X 1 = x] .

(25)

( LOG )- VRAISEMBLANCE

D´efinition (Vraisemblance et log-vraisemblance)

La vraisemblance de X est d´efinie pour tout θ ∈ Θ par L X (θ) =

n

Y

i=1

f θ ( X i ) .

La log-vraisemblance de X est d´efinie pour tout θ ∈ Θ par

l X (θ) = log ( L X (θ)) = log

n

Y

i=1

f θ ( X i )

! .

Attention ! La (log-)vraisemblance est al´eatoire.

(26)

E XEMPLES : CAS DISCRET

Exemple 1 : loi de Bernoulli. On consid`ere X = (X 1 , . . . , X n ) o `u les X i sont i.i.d et X 1 ∼ B(θ) avec θ ∈ (0, 1).

Exemple 2 : loi de Poisson. On consid`ere X = (X 1 , . . . , X n ) o `u

les X i sont i.i.d et X 1 suit une loi de Poisson de param`etre θ > 0.

(27)

E XEMPLES : CAS CONTINU

Exemple 1 : loi exponentielle. On consid`ere X = ( X 1 , . . . , X n ) o `u les X i sont i.i.d et X 1 ∼ E (θ) avec θ > 0.

Exemple 2 : loi normale. On consid`ere X = ( X 1 , . . . , X n ) o `u les X i sont i.i.d et X 1 ∼ N µ, σ ²

avec µ ∈ R.

Exemple 3 : On considère X = ( X 1 , . . . , X n ) o ù les X i sont i.i.d et X 1 admet pour densité f θ définie pour tout x ∈ R par

f θ ( x ) = θ x ² 1 x≥θ

avec θ > 0.

(28)

R EMARQUES

Cas discret La réalisation de la vraisemblance est la probabilité de d’obtenir cette réalisation de l’échantillon.

Cas continue La réalisation de la vraisemblance est la densité de X en la réalisation de l’échantillon.

Objectifs : Maximiser cette probabilit´e (ou densit´e).

(29)

E STIMATEUR DU MAXIMUM DE VRAISEMBLANCE

D´efinition (Estimateur du maximum de vraisemblance (EMV))

Le maximum de vraisemblance, si il existe, est un élément θ ˆ _n de Θ qui vérifie

L X

θ ˆ _n

= sup

θ∈Θ L X (θ).

De manière équivalente, l’estimateur du maximum de vraisemblance, si il existe, vérifie

l X

θ ˆ _n

= sup

θ∈Θ

l X (θ).

(30)

R EMARQUES

Attention ! L’EMV est généralement aléatoire.

Attention ! Ni l’existence ni l’unicit´e de l’EMV ne sont assur´ees.

Remarque : A noter que si θ ˆ _n est un EMV de θ , alors ϕ θ ˆ _n

est un EMV de ϕ(θ) .

Remarque : On notera ´egalement θ ˆ _n = arg max

θ∈Θ L X (θ) ou θ ˆ _n = arg max

θ∈Θ l X (θ)

(31)

E XEMPLES : CAS DISCRET

Exemple 1 : loi de Bernoulli. On consid`ere X = (X 1 , . . . , X n ) o `u les X i sont i.i.d et X 1 ∼ B(θ) avec θ ∈ (0, 1).

Exemple 2 : loi de Poisson. On consid`ere X = (X 1 , . . . , X n ) o `u

les X i sont i.i.d et X 1 suit une loi de Poisson de param`etre θ > 0.

(32)

E XEMPLES : CAS CONTINU

Exemple 1 : loi exponentielle. On consid`ere X = ( X 1 , . . . , X n ) o `u les X i sont i.i.d et X 1 ∼ E (θ) avec θ > 0.

Exemple 2 : loi normale. On consid`ere X = ( X 1 , . . . , X n ) o `u les X i sont i.i.d et X 1 ∼ N µ, σ ²

avec µ ∈ R.

Exemple 3 : On considère X = ( X 1 , . . . , X n ) o ù les X i sont i.i.d et X 1 admet pour densité f θ définie pour tout x ∈ R par

f θ ( x ) = θ x ² 1 x≥θ

avec θ > 0.

(33)

C OMMENT TROUVER L ’EMV

Soit l’EMV peut ˆetre donn´e ”explicitement” par la

vraisemblance, soit il est souvent plus facile de maximiser la log-vraisemblance. Pour cela, voici quelques options

possibles :

I Dresser le tableau de variations de la log vraisemblance I Chercher les zéros de la dérivée, i.e résoudre

l ⁰ _X (θ) = 0 .

I V´erifier qu’il(s) maximise(nt) la log-vraisemblance (´etude

de la concavit´e, ...)

(34)

U N CAS D ’ ´ ETUDE

Exemple : Soit X 1 , . . . , X n des variables al´eatoires i.i.d suivant une loi uniforme sur [ 0 , θ] , avec θ > 0.

I M´ethode des moments ?

I M´ethode du maximum de vraisemblance ?

(35)

O BJECTIFS

On s’intéresse à l’estimation d’un paramètre θ ∈ Θ d’une variable aléatoire X, avec Θ un intervalle ouvert de R. Les objectifs sont donc :

I Comparer diff´erents estimateurs de θ.

I Savoir si on peut parler d’estimateur optimal.

(36)

V. Comparaison d’estimateurs

(37)

C OMPARAISON DES ERREURS QUADRATIQUES MOYENNES

On rappelle qu’une façon de quantifier la qualité d’un estimateur θ ˆ _n de θ est de considérer son risque quadratique

EQM

θ ˆ _n , θ

= E

θ ˆ _n − θ 2 .

On consid`ere que θ ˆ _n est un meilleur estimateur que θ ˜ _n si

∀θ ∈ Θ, EQM θ ˆ _n , θ

≤ EQM θ ˜ _n , θ

.

(38)

B IAIS D ’ UN ESTIMATEUR

On donne trop souvent trop d’importance au biais d’un estimateur ! Débiaiser un estimateur ne donne pas forcément de meilleurs résultats !

Exemple : Soit θ > 0 et X ∼ U ([0, θ]). Comparer les erreurs quadratiques moyennes des estimateurs suivants :

Statistique inf´erentielle Estimation

Estimation

A. Godichon-Baggioni

O BJECTIFS

On dispose de n données x 1 , . . . , x n qui sont des mesures d’une variable quantitative, et plus précisément des réalisations de variables aléatoires indépendantes et identiquement

distribu´ees X 1 , . . . , X n . Objectifs :

I Estimer une caract´eristique θ de X 1 (moyenne, variance,...) I Estimer un param`etre θ de X 1 si cette variable est

param´etr´ee (loi de Bernoulli, normale, exponentielle,...) Exemples :

I Lancer de pièce : On s’intéresse à l’estimation de θ = E [X 1 ].

I Loi exponentielle : On s’int´eresse `a l’estimation du

param`etre θ = ( E [X 1 ]) −1 .

I. D´efinitions

S TATISTIQUE ET ESTIMATEUR

Dans ce qui suit, on considère un échantillon X = ( X 1 , . . . , X n ) dépendant d’un paramètre θ ∈ Θ , o ù Θ ⊂ R.

D´efinition

Une statistique T ( X ) est une fonction mesurable de l’échantillon X ne dépendant pas de θ (mais dépendant éventuellement de paramètres connus). Un estimateur de θ est une statistique θ ˆ = θ ( X ) destinée à approcher θ.

Exemple : Lancer de pi`ece

Attention ! Ne pas confondre estimateur et estimation !

Notation : Dans ce qui suit, on consid`ere θ ˆ n un estimateur de θ .

E RREUR QUADRATIQUE MOYENNE

D´efinition

On suppose que θ est `a valeurs dans Θ ⊂ R. L’erreur quadratique moyenne (ou risque quadratique) de l’estimateur θ ˆ n est d´efinie pour tout θ ∈ Θ par

EQM

θ ˆ n , θ

= E

θ ˆ n − θ 2 .

Remarquons que grâce à l’inégalité de Markov, pour tout c > 0,

P h

θ ˆ n − θ ≥ c i

≤ EQM θ ˆ n , θ

c 2 .

B IAIS D ’ UN ESTIMATEUR

D´efinition

On appelle biais d’un estimateur θ ˆ n de θ la quantit´e B

θ ˆ n , θ

= E h θ ˆ n i

− θ.

1. S’il est nul, on dit que l’estimateur est sans biais ou non biais´e 2. Si

B θ ˆ n , θ

− −−−− →

n→+∞ 0,

on dit que l’estimateur est asymptotiquement sans biais.

Exemple : lancer de pi`ece. L’estimateur θ ˆ n est sans biais.

D ´ ECOMPOSITION B AIS -V ARIANCE

Proposition

Soit θ ˆ n un estimateur de θ , on a

EQM

θ ˆ n , θ

= B θ ˆ n , θ 2

+ V h θ ˆ n i

.

Exemple : lancer de pi`ece Comme θ ˆ n est un estimateur sans biais de θ , on a

EQM

θ ˆ n , θ

= V h θ ˆ n i

= θ( 1 − θ)

n .

C ONVERGENCE , CONSISTANCE ET NORMALIT E ´

ASYMPTOTIQUE D´efinition

On dit que l’estimateur θ ˆ n est 1. convergent ou consistant si

θ ˆ n − −−−− P →

n→+∞ θ,

2. fortement consistant si

θ ˆ n − −−−− p.s →

n→+∞ θ,

3. asymptotiquement normal si il existe σ 2 > 0 tel que

√ n

θ ˆ n − θ L

− −−−− →

n→+∞ N 0 , σ 2

.

II. Estimation de la moyenne et de la

variance

E STIMATION DE LA MOYENNE

Soient X 1 , . . . , X n des variables aléatoires indépendantes et identiquement distribuées. Un estimateur naturel de la moyenne µ = E [ X 1 ] est donc

X n = 1 n

n

X

i=1

X i .

param`etre θ = ( E [X 1 ]) ⁻¹ .

Notation : Dans ce qui suit, on consid`ere θ ˆ _n un estimateur de θ .

On suppose que θ est `a valeurs dans Θ ⊂ R. L’erreur quadratique moyenne (ou risque quadratique) de l’estimateur θ ˆ _n est d´efinie pour tout θ ∈ Θ par

θ ˆ _n , θ

θ ˆ _n − θ 2 .

θ ˆ _n − θ ≥ c i

≤ EQM θ ˆ _n , θ

c ² .

On appelle biais d’un estimateur θ ˆ _n de θ la quantit´e B

θ ˆ _n , θ

= E h θ ˆ _n i

B θ ˆ _n , θ

Exemple : lancer de pi`ece. L’estimateur θ ˆ _n est sans biais.

Soit θ ˆ _n un estimateur de θ , on a

θ ˆ _n , θ

= B θ ˆ _n , θ 2

+ V h θ ˆ _n i

Exemple : lancer de pi`ece Comme θ ˆ _n est un estimateur sans biais de θ , on a

θ ˆ _n , θ

= V h θ ˆ _n i

On dit que l’estimateur θ ˆ _n est 1. convergent ou consistant si

θ ˆ _n − −−−− ^P →

θ ˆ _n − −−−− ^p.s →

3. asymptotiquement normal si il existe σ ² > 0 tel que

θ ˆ _n − θ _L

n→+∞ N 0 , σ ²

1. X n est un estimateur sans biais et (fortement) consistant de µ . 2. Si σ ² = V [ X 1 ] < +∞, alors X n est asymptotiquement normal

n→+∞ N 0 , σ ² EQM X n , µ

= σ ²

( X i − µ) ²

σ _n ² = 1 n

X _i ² − X ² _n .

σ _n ² est un estimateur biaisi´e de σ ² mais asymptotiquement sans biais.

ˆ σ ² _n

= n − 1 n σ ² .

L’estimateur sans biais de la variance S ² _n est d´efini par

S ² _n = n

n − 1 σ ˆ ² _n = 1 n − 1

X ² _i − nX ² _n

Les estimateurs σ ˆ _n ² et S ² _n sont consistants.

Si X 1 admet un moment d’ordre 4, alors σ ˆ ² _n et S ² _n sont asymptotiquement normaux, et on a

√ n σ ˆ ² _n − σ ² L

n→+∞ N 0 , τ ⁴ − σ ⁴

√ n S ² _n − σ ² L