MontDore,mai2010 P.Rochet Efﬁcacitésemi-paramétriquepourlaméthodedesmomentsgénéralisée

(1)

Théorie de l’efficacité Problème et résultats

Efficacité semi-paramétrique pour la méthode des moments généralisée

P. Rochet

Université Toulouse 3

Institut de Mathématiques, Equipe Statistique et Probabilités

Mont Dore, mai 2010

(2)

Plan

1 Théorie de l’efficacité

Estimation d’un paramètre Efficacité

2 Problème et résultats

(3)

Estimation d’un paramètre Efficacité

Plan

1 Théorie de l’efficacité

Estimation d’un paramètre Efficacité

2 Problème et résultats

(4)

Estimation d’un paramètre

Observations iid X ₁ , ..., X _n de loi µ.

But : estimer un paramètre θ 0 = θ(µ).

Le problème se caractérise par

un modèle M : ensemble de mesures, valeurs possibles de µ (on suppose µ ∈ M),

un paramètre θ : application θ : M → Θ ⊂ R ^d .

(5)

Estimation du paramètre

On note :

µ _n = 1 n

n

X

i=1

δ _X

_i

.

Deux façons naturelles pour estimer θ 0 .

1ère idée : Construire un estimateur µ ˆ ∈ M de µ à partir des observations et définir θ ˆ = θ(ˆ µ).

2ème idée : Etendre θ à un modèle plus grand P contenant µ _n : θ : P → Θ, et définir θ ˆ = θ(µ _n ).

Agrandissement du modèle = ⇒ perte d’information.

(6)

Efficacité semi-paramétrique

On distingue en statistique 3 types de modèles : Paramétrique : M = {µ _θ , θ ∈ Θ ⊂ R ^d }.

Non-paramétrique : M = P : l’ensemble des mesures de proba sur X .

Semi-paramétrique : entre les deux.

ex : paramètre de dim. infinie, mesures à densité par

rapport à λ, mesures de moyennes nulles, etc...

(7)

Information de Fisher

Calcul de l’Information de Fisher

dans un modèle paramétrique {µ _θ , θ ∈ Θ} : I ({µ _θ }) =

Z

∂

∂θ |θ

₀

log d µ _θ d µ

2 d µ.

dans un modèle semi ou non-paramétrique : I(M) = inf

{µ

_θ

}⊂M I({µ _θ }).

Remarques :

+ le modèle est grand, - on a d’information.

+ l’application θ(.) est "lisse", + on a d’information.

(8)

Borne d’efficacité

On note B(M) = I ⁻¹ (M).

Théorème (Asymptotic statistics, van der Vaart (1998))

Si T = T (X ₁ , ..., X _n ) est un estimateur asymptotiquement sans biais de θ dans un modèle M, alors

n→∞ lim n var(T ) ≥ B(M).

Généralisation de l’inégalité de Cramer-Rao aux modèles semi et non-paramétriques.

B(M) est la borne d’efficacité du problème.

(9)

Plan

1 Théorie de l’efficacité

Estimation d’un paramètre Efficacité

2 Problème et résultats

(10)

Le problème

Echantillon X ₁ , ..., X n iid de loi µ inconnue, dans un espace probabilisé (X , B(X )).

On veut estimer θ ₀ ∈ Θ ⊂ R ^d tel que F (θ ₀ , µ) =

Z

Φ(x , θ ₀ )dµ = 0, où Φ : X × Θ → R ^k connue. On suppose k ≥ d.

Φ(x, θ) =

x − θ x ² − v (θ)

.

Problème étudié en économétrie (Hansen (1982), Chamberlain

(1987), Qin & Lawless (1994)).

(11)

Le problème

Echantillon X ₁ , ..., X n iid de loi µ inconnue, dans un espace probabilisé (X , B(X )).

On veut estimer θ ₀ ∈ Θ ⊂ R ^d tel que F (θ ₀ , µ) =

Z

Φ(x , θ ₀ )dµ = 0, où Φ : X × Θ → R ^k connue. On suppose k ≥ d.

Ex : variance fonction de la moyenne, Φ(x , θ) =

x − θ x ² − v (θ)

.

Problème étudié en économétrie (Hansen (1982), Chamberlain

(1987), Qin & Lawless (1994)).

(12)

Application au problème

Contrainte de moment F (θ ₀ , µ) =

Z

Φ(x , θ ₀ )d µ = 0.

Le modèle : M =

ν : ∃θ = θ(ν) ∈ Θ, R

Φ θ d ν = 0 Le paramètre : θ(ν) : zéro de θ 7→ R

Φ θ d ν.

Théorème (Qin et Lawless (1994)) Soit D = R _∂

∂θ Φ(., θ ₀ )d µ et V = R

Φ(., θ ₀ )Φ(., θ ₀ ) ^t d µ, B(M) = h

DV ⁻¹ D ^t i −1

.

(13)

Vraisemblance empirique généralisée (GEL)

1ère idée : Construire µ ˆ ∈ M et définir θ ˆ = θ(ˆ µ).

Estimateur GEL

Soit f convexe avec f (1) = f ⁰ (1) = 0, on définit ˆ

µ = argmin

ν∈M

Z f

dν d µ _n

d µ _n

Atteint la borne semi-paramétrique asymptotiquement.

ˆ

µ est parfois difficile à déterminer explicitement.

(14)

Méthode des moments généralisée (GMM)

2ème idée : Etendre θ, θ : P → Θ et définir θ ˆ = θ(µ n ).

Estimateur GMM

Soit M une matrice symétrique définie positive , θ(ν) = argmin

θ∈Θ

kF (θ, ν)k _M = argmin

θ∈Θ

F (θ, ν) ^t MF(θ, ν).

Estimateur plus facile à implémenter.

Modèle plus grand = ⇒ moins d’efficacité.

(15)

Résultat

Méthode des moments généralisée :

Le modèle : P (modèle non-paramétrique).

Le paramètre : θ _M (ν) = argmin

θ∈Θ

kF (θ, ν )k _M .

Théorème

Dans le modèle P , la borne semi-paramétrique pour estimer θ M

est

B(P ) =

DMD ^t ⁻¹

DMVMD ^t DMD ^t ⁻¹ . B(P ) dépend du choix de la matrice M.

Choisir M telle que l’extension θ _M soit efficace.

(16)

Résultats

On rappelle : B(M) =

DV ⁻¹ D ^t −1

Lemme

DMD ^t ⁻¹

DMVMD ^t DMD ^t ⁻¹

≥ h

DV ⁻¹ D ^t i −1

, avec égalité :

- pour tout M si d = k , - pour M = V ⁻¹ si k > d.

Comme on pouvait s’y attendre M ⊆ P = ⇒ B(P) ≥ B(M).

GMM optimal : M = V ⁻¹ (cf Chamberlain (1987)).

(17)

Résultats

GMM avec contrainte approchée :

On observe une approximation de la contrainte Φ m → Φ.

Théorème

Sous les hypothèses : Z

( √ n sup

θ∈θ

kΦ _m (., θ) − Φ(., θ)k) ¹² dµ → 0

∃ V voisinage de θ ₀ , Z

( √ n sup

θ∈V

k∇Φ _m (., θ) − ∇Φ(., θ)k) ¹² dµ → 0,

le GMM optimal reste efficace avec la contrainte approchée.

(18)

MERCI

MontDore,mai2010 P.Rochet Efﬁcacitésemi-paramétriquepourlaméthodedesmomentsgénéralisée

Efficacité semi-paramétrique pour la méthode des moments généralisée

P. Rochet

Université Toulouse 3

Institut de Mathématiques, Equipe Statistique et Probabilités

Mont Dore, mai 2010

Plan

1 Théorie de l’efficacité

Estimation d’un paramètre Efficacité

2 Problème et résultats

Plan

1 Théorie de l’efficacité

Estimation d’un paramètre Efficacité

2 Problème et résultats

Estimation d’un paramètre

Observations iid X 1 , ..., X n de loi µ.

But : estimer un paramètre θ 0 = θ(µ).

Le problème se caractérise par

un modèle M : ensemble de mesures, valeurs possibles de µ (on suppose µ ∈ M),

un paramètre θ : application θ : M → Θ ⊂ R d .

Estimation du paramètre

On note :

µ n = 1 n

n

X

i=1

δ X

.

Deux façons naturelles pour estimer θ 0 .

1ère idée : Construire un estimateur µ ˆ ∈ M de µ à partir des observations et définir θ ˆ = θ(ˆ µ).

2ème idée : Etendre θ à un modèle plus grand P contenant µ n : θ : P → Θ, et définir θ ˆ = θ(µ n ).

Agrandissement du modèle = ⇒ perte d’information.

Efficacité semi-paramétrique

On distingue en statistique 3 types de modèles : Paramétrique : M = {µ θ , θ ∈ Θ ⊂ R d }.

Non-paramétrique : M = P : l’ensemble des mesures de proba sur X .

Semi-paramétrique : entre les deux.

ex : paramètre de dim. infinie, mesures à densité par

rapport à λ, mesures de moyennes nulles, etc...

Information de Fisher

Calcul de l’Information de Fisher

dans un modèle paramétrique {µ θ , θ ∈ Θ} : I ({µ θ }) =

Z

∂

∂θ |θ

log d µ θ d µ

2

d µ.

dans un modèle semi ou non-paramétrique : I(M) = inf

{µ

}⊂M I({µ θ }).

Remarques :

+ le modèle est grand, - on a d’information.

+ l’application θ(.) est "lisse", + on a d’information.

Borne d’efficacité

On note B(M) = I −1 (M).

Théorème (Asymptotic statistics, van der Vaart (1998))

Si T = T (X 1 , ..., X n ) est un estimateur asymptotiquement sans biais de θ dans un modèle M, alors

n→∞ lim n var(T ) ≥ B(M).

Généralisation de l’inégalité de Cramer-Rao aux modèles semi et non-paramétriques.

B(M) est la borne d’efficacité du problème.

Plan

1 Théorie de l’efficacité

Estimation d’un paramètre Efficacité

2 Problème et résultats

Le problème

Echantillon X 1 , ..., X n iid de loi µ inconnue, dans un espace probabilisé (X , B(X )).

On veut estimer θ 0 ∈ Θ ⊂ R d tel que F (θ 0 , µ) =

Z

Φ(x , θ 0 )dµ = 0, où Φ : X × Θ → R k connue. On suppose k ≥ d.

Φ(x, θ) =

x − θ x 2 − v (θ)

.

Problème étudié en économétrie (Hansen (1982), Chamberlain

(1987), Qin & Lawless (1994)).

Le problème

Echantillon X 1 , ..., X n iid de loi µ inconnue, dans un espace probabilisé (X , B(X )).

On veut estimer θ 0 ∈ Θ ⊂ R d tel que F (θ 0 , µ) =

Z

Φ(x , θ 0 )dµ = 0, où Φ : X × Θ → R k connue. On suppose k ≥ d.

Ex : variance fonction de la moyenne, Φ(x , θ) =

Observations iid X ₁ , ..., X _n de loi µ.

un paramètre θ : application θ : M → Θ ⊂ R ^d .

µ _n = 1 n

δ _X

2ème idée : Etendre θ à un modèle plus grand P contenant µ _n : θ : P → Θ, et définir θ ˆ = θ(µ _n ).

On distingue en statistique 3 types de modèles : Paramétrique : M = {µ _θ , θ ∈ Θ ⊂ R ^d }.

dans un modèle paramétrique {µ _θ , θ ∈ Θ} : I ({µ _θ }) =

log d µ _θ d µ

}⊂M I({µ _θ }).

On note B(M) = I ⁻¹ (M).

Si T = T (X ₁ , ..., X _n ) est un estimateur asymptotiquement sans biais de θ dans un modèle M, alors

Echantillon X ₁ , ..., X n iid de loi µ inconnue, dans un espace probabilisé (X , B(X )).

On veut estimer θ ₀ ∈ Θ ⊂ R ^d tel que F (θ ₀ , µ) =

Φ(x , θ ₀ )dµ = 0, où Φ : X × Θ → R ^k connue. On suppose k ≥ d.

x − θ x ² − v (θ)

Echantillon X ₁ , ..., X n iid de loi µ inconnue, dans un espace probabilisé (X , B(X )).

On veut estimer θ ₀ ∈ Θ ⊂ R ^d tel que F (θ ₀ , µ) =

Φ(x , θ ₀ )dµ = 0, où Φ : X × Θ → R ^k connue. On suppose k ≥ d.

x − θ x ² − v (θ)

Contrainte de moment F (θ ₀ , µ) =

Φ(x , θ ₀ )d µ = 0.

Théorème (Qin et Lawless (1994)) Soit D = R _∂

∂θ Φ(., θ ₀ )d µ et V = R

Φ(., θ ₀ )Φ(., θ ₀ ) ^t d µ, B(M) = h

DV ⁻¹ D ^t i −1

Soit f convexe avec f (1) = f ⁰ (1) = 0, on définit ˆ

dν d µ _n

d µ _n

kF (θ, ν)k _M = argmin

F (θ, ν) ^t MF(θ, ν).

Le paramètre : θ _M (ν) = argmin

kF (θ, ν )k _M .

DMD ^t ⁻¹

DMVMD ^t DMD ^t ⁻¹ . B(P ) dépend du choix de la matrice M.

Choisir M telle que l’extension θ _M soit efficace.

DV ⁻¹ D ^t −1

DMD ^t ⁻¹

DMVMD ^t DMD ^t ⁻¹

DV ⁻¹ D ^t i −1

- pour tout M si d = k , - pour M = V ⁻¹ si k > d.

GMM optimal : M = V ⁻¹ (cf Chamberlain (1987)).