Le support de la loi dépend du paramètre à estimer donc le modèle n’est pas régulier

(1)

Université de Strasbourg Année 2009/2010 L3 - Statistique Mathématique

Cours : S´egolen Geffray TD : Gilles Stupfler

Eléments de réponses – Examen de la session de printemps 2009/2010 Les résultats doivent tous êtres démontrés, les réponses doivent toutes être rédigées.

Exercice 1.

Rappeler la définition d’un modèle régulier et d’un modèle dominé.

1. Le support de la loi dépend du paramètre à estimer donc le modèle n’est pas régulier.

Le mod`ele est domin´e par la mesure de comptage.

2. Le modèle n’est pas dominé donc n’est pas régulier.

3. Il ne s’agit pas d’un mod`ele statistique.

Exercice 2.

Soient X₁, ..., X_n variables al´eatoires i.i.d. de variable parente X de loi E(λ).

1. D´eterminons un estimateur pour λ.

La m´ethode des moments fournitλe_n= 1

X_n avecX_n = 1 n

n

X

i=1

X_i. La m´ethode du maximum de vraisemblance fournit bλ_n = 1

Xn

, autrement dit, les deux estimateurs co¨ıncident.

2. Etudions le comportement asymptotique de bλn.

La loi exponentielle admet des moments d’ordre 1 et 2 qui sont :E[X] = 1/λet Var(X) = 1/λ².

La loi forte des grands nombres (valable pour les suites de variables al´eatoires i.i.d. admettant un moment d’ordre 1) nous dit que

1 n

n

X

i=1

X_i ^n→∞−→ E[X] = 1

λ presque-sˆurement.

Comme la fonction x→ 1/x est continue surR^∗+ qui est le support de la loi des X_i, on en d´eduit que

bλn

n→∞−→ λ presque-sˆurement ce qui signifie que bλ_n est fortement consistant.

Pour obtenir la convergence en loi de bλ_n correctement centré et normalisé, on peut pro- céder selon deux méthodes.

1ère méthode : appliquer le TCL pour l’EMV (à énoncer) La loi exponentielle appartient à la famille exponentielle car f_λ(x) = exp(−λx−logλ)I(x≥0)

donc on identifie la forme exponentielle canonique (à rappeler) en posanth(x) =I(x≥0), θ =λ, T(x) = −xet B(θ) = log(λ). On en déduit que la loi exponentielle est régulière.

(2)

L’estimateur λb_n est l’EMV de λ calculé à partir d’observations i.i.d. dans un modèle régulier et est fortement consistant donc le TCL pour l’EMV s’applique et fournit quand n → ∞ la convergence en loi :

√n(bλ_n−λ)−→ N^D (0, I(λ)⁻¹)

avec I(λ) que l’on peut calculer en utilisant la troisième définition (à énoncer) puisque le modèle est régulier, ce qui donne après calculs I(λ) = 1/λ².

On en conclut que

√n(bλ_n−λ)−→ N^D (0, λ²).

2ème méthode : appliquer le TCL pour v.a.i.i.d. (à énoncer) puis la delta-méthode univariée (à énoncer)

Le TCL pour v.a.i.i.d. admettant des moments d’ordre 1 et 2 permet d’affirmer que

√n(X_n−E[X])−→ N^D (0,Var(X))

soit √

n(X_n−1/λ)−→^D Z ∼ N(0,1/λ²).

Appliquons ensuite la delta-méthode univariée avecg :x→1/xdérivable surX(Ω) =R^∗+

avec g⁰(x) =−1/x² :

√n(g(X_n)−g(1/λ))−→^D g⁰(1/λ).Z

soit √

n(bλ_n−λ)−→ N^D (0, λ²).

3. D´eterminons un intervalle de confiance pour λ au niveau de confiance 1−α= 0.95.

1ère étape: déterminons une statistique pivotaleTnpourλ. En utilisant ce qui précède, la LFGN et le théorème de Slutsky, on obtient

T_n=√

nbλ_n−λ bλn

−→ ND (0,1).

2ème étape : déterminons a et b tels que P[a ≤ T_n ≤ b] = 0.95. En répartissant le risque de fa¸con symétrique, on obtient −a =b= Φ⁻¹(0.975) = 1.96 avec Φ= fonction de répartition de la loi N(0,1).

3ème étape : on inverse l’intervalle précédent en

P

"

bλ_n−1.96bλ_n

√n ≤λ ≤bλ_n+ 1.96bλ_n

√n

#

= 0.95

4. On veut estimer p = P[15 ≤ X ≤ 20] = F(20)− F(15) = e^−15λ − e^−20λ. Proposons pb_n =e^−15b^λⁿ −e^−20b^λⁿ.

On a déjà fait bλ_n ^n→∞−→ λ presque-sûrement. Comme la fonctiong :x→e^−15x−e^−20x est continue sur R, on en déduit quepbn

n→∞−→ ppresque-sˆurement.

On a d´ej`a fait √

n(bλ_n−λ) −→ N^D (0, λ²). Appliquons la delta-m´ethode avec la fonction g :x→e^−15x−e^−20x d´erivable sur R etg⁰(x) = −15e^−15x+ 20e^−20x, ce qui donne

√n(bp_n−p)−→ N^D (0, λ²(−15e^−15λ+ 20e^−20λ)²).

(3)

On peut obtenir (d´etailler la m´ethode et les calculs) l’intervalle de confiance pourpa 95%` de niveau de confiance :

P

"

pb_n−1.96bλ_n

√n

−15e^−15b^λⁿ+ 20e^−20b^λⁿ

≤p≤pb_n+ 1.96bλ_n

√n

−15e^−15b^λⁿ + 20e^−20b^λⁿ

#

= 0.95

5. On veut estimerN = 1000P[X ≤15] = 1000(1−e^−15λ). ProposonsNb_n= 1000(1−e^−15b^λⁿ).

On obtient la consistance forte et la convergence en loi comme précédemment (à faire).

On en déduit toujours comme précédemment (à faire) l’intervalle de confiance pour N à 95% de niveau de confiance :

P

"

Nb_n−1.96bλ_n

√n

15000e⁻¹⁵^b^λⁿ

≤N ≤Nb_n+ 1.96bλ_n

√n

15000e⁻¹⁵^b^λⁿ

#

= 0.95

Exercice 3.

1. f_θ est une densit´e de probabilit´e ssi f_θ(x)≥0 pour tout x∈Ret Z

f_θ(x)dµ(x) = 1 pour µ mesure dominante du mod`ele qui est ici la mesure de Lebesgue.

2. E^θ[X] = 2

3θ, Varθ(X) = 1

18θ² etFθ(x) =











0 si x <0 x²

θ² si 0≤x < θ 1 si x≥θ

.

3. Utilisons la première définition de l’information de Fisher valable sous les hypothèses (H₁) et (H2) à rappeler et à vérifier. On obtientI(θ) = 4

θ². 4. L’estimateur de la m´ethode des moments de θ est eθ_n= 3

2X_n.

5. L’estimateur de la m´ethode du maximum de vraisemblance deθ estθb_n= max(X₁, ..., X_n).

6. Eθ[eθ_n] = θ donc θe_n est non biais´e, Var_θ(eθ_n) = θ²

8n donc θe_n est convergent en moyenne quadratique vers θ,R_θ(eθ_n) = θ²

8n.

D´eterminons la loi de θb_n : P[bθ_n ≤ x] =











0 si x <0 x²ⁿ

θ²ⁿ si 0≤x < θ 1 si x≥θ

donc la densit´e de la

loi de θb_n par rapport `a la mesure de Lebesgue est f_b_θ

n(x) = 2nx²ⁿ⁺¹

θ²ⁿ I(0 ≤ x ≤ θ).

On en d´eduit E^θ[bθ_n] = 2nθ

2n+ 1 donc bθ_n est biais´e mais asymptotiquement non biais´e, Varθ(bθn) = nθ²

(n+ 1)(2n+ 1)², Rθ(bθn) = nθ²

(n+ 1)(2n+ 1)² +θ²

2n 2n+ 1 −1

2

doncθbn est convergent en moyenne quadratique vers θ mais la vitesse de cette convergence est moins rapide que celle de la convergence de θe_n.

7. Le modèle n’est pas régulier car X(Ω) dépend du paramètre à estimer. La borne de Fréchet-Darmois-Cramer-Rao ne s’applique donc pas.

(4)

8. Le TCL pour v.a.i.i.d. admettant des moments d’ordre 1 et 2 permet d’affirmer

√n(eθn−θ)−→ N^D

0,θ² 18

.

La convergence en loi de θb_n correctement centré et normalisé s’établit à la main :

P h

n(bθ_n−θ)≤xi

=











0 si x <−nθ

1 + x nθ

2n

si −nθ≤x <0 1 si x≥0

On en d´eduit

P h

n(bθ_n−θ)≤xi_n→∞

−→

(e^2x/θ si x <0 1 si x≥0 Ceci montre que

n(bθ_n−θ)−→ −Z^D o`u Z ∼ E

2 θ

. Exercice 4.

1. E[X−Z|Y −X] =−3 doncL(E[X−Z|Y −X]) =δ−3

2. L’ensemble des variables η_a,b,c indépendantes de U est caractérisé par la relation a= 7b.

3.

Y −X Z−X

∼ N₂

−1 3

,

11 0 0 3

4.



 Y X Z



∼ N₃







 1 2 5



,





9 1 −1

1 4 2

−1 2 3









Exercice 5.

1. E[Y|U, V] =aU+bV+c, Var(Y|U, V) = σ², les covariablesU etV influent sur la moyenne de Y de fa¸con linéaire avec une erreur aléatoire centrée.

2. La d´etermination de (ba,bb,bc) estimateur des moindres carr´es de (a, b, c) peut se faire ou bien en annulant le vecteur gradient de Q(a, b, c) =

n

X

i=1

(Y_i−aU_i−bV_i−c)² et en vérifiant que la matrice hessienne en la solution obtenue est définie positive ou bien (et c’est mieux) en appliquant le théorème de projection orthogonale sur un sous-espace vectoriel de Rⁿ. Rappel du théorème de projection sur un sous espace vectoriel fermé d’un espace de Hilbert :

Soit F un sous espace vectoriel ferm´e d’un espace de Hilbert muni d’un produit scalaire h., .i et d’une norme k.k. Alors, pour tout Y de H, il existe un unique point not´e pF(Y) tel que kY−p_F(Y)k = inf

U∈FkY−Uk et qui se caract´erise par deux conditions `a savoir (pF(Y)∈F,

Y−pF(Y)∈F^⊥.

Quelle que soit la m´ethode employ´ee, on obtient bb = R_{Y V}R_U² −R_{U V}R_{U Y}

R_V²R_U²−(R_{U V})² , ba= R_{U Y}

R_U² − R_{U V}

R_U²bb, bc=Y_n−U_nba−V_nbb

(5)

en notant

R_U² = (U²)_n−(U_n)², R_V² = (V²)_n−(V_n)²

R_{U V} = (U V)_n−U_nV_n, R_{U Y} = (U Y)_n−U_nY_n, R_{V Y} = (V Y)_n−V_nY_n et avec

Y_n= 1 n

n

X

i=1

Y_i, U_n= 1 n

n

X

i=1

U_i, V_n = 1 n

n

X

i=1

V_i, (U V)_n = 1 n

n

X

i=1

U_iV_i

(U Y)_n= 1 n

n

X

i=1

U_iY_i, (V Y)_n = 1 n

n

X

i=1

V_iY_i, (U²)_n= 1 n

n

X

i=1

U_i², (V²)_n = 1 n

n

X

i=1

V_i².