Universit´e de Strasbourg Ann´ee 2009/2010 L3 - Statistique Math´ematique
Cours : S´egolen Geffray TD : Gilles Stupfler
El´ements de r´eponses – Examen de la session de printemps 2009/2010 Les r´esultats doivent tous ˆetres d´emontr´es, les r´eponses doivent toutes ˆetre r´edig´ees.
Exercice 1.
Rappeler la d´efinition d’un mod`ele r´egulier et d’un mod`ele domin´e.
1. Le support de la loi d´epend du param`etre `a estimer donc le mod`ele n’est pas r´egulier.
Le mod`ele est domin´e par la mesure de comptage.
2. Le mod`ele n’est pas domin´e donc n’est pas r´egulier.
3. Il ne s’agit pas d’un mod`ele statistique.
Exercice 2.
Soient X1, ..., Xn variables al´eatoires i.i.d. de variable parente X de loi E(λ).
1. D´eterminons un estimateur pour λ.
La m´ethode des moments fournitλen= 1
Xn avecXn = 1 n
n
X
i=1
Xi. La m´ethode du maximum de vraisemblance fournit bλn = 1
Xn
, autrement dit, les deux estimateurs co¨ıncident.
2. Etudions le comportement asymptotique de bλn.
La loi exponentielle admet des moments d’ordre 1 et 2 qui sont :E[X] = 1/λet Var(X) = 1/λ2.
La loi forte des grands nombres (valable pour les suites de variables al´eatoires i.i.d. ad- mettant un moment d’ordre 1) nous dit que
1 n
n
X
i=1
Xi n→∞−→ E[X] = 1
λ presque-sˆurement.
Comme la fonction x→ 1/x est continue surR∗+ qui est le support de la loi des Xi, on en d´eduit que
bλn
n→∞−→ λ presque-sˆurement ce qui signifie que bλn est fortement consistant.
Pour obtenir la convergence en loi de bλn correctement centr´e et normalis´e, on peut pro- c´eder selon deux m´ethodes.
1`ere m´ethode : appliquer le TCL pour l’EMV (`a ´enoncer) La loi exponentielle appartient `a la famille exponentielle car fλ(x) = exp(−λx−logλ)I(x≥0)
donc on identifie la forme exponentielle canonique (`a rappeler) en posanth(x) =I(x≥0), θ =λ, T(x) = −xet B(θ) = log(λ). On en d´eduit que la loi exponentielle est r´eguli`ere.
L’estimateur λbn est l’EMV de λ calcul´e `a partir d’observations i.i.d. dans un mod`ele r´egulier et est fortement consistant donc le TCL pour l’EMV s’applique et fournit quand n → ∞ la convergence en loi :
√n(bλn−λ)−→ ND (0, I(λ)−1)
avec I(λ) que l’on peut calculer en utilisant la troisi`eme d´efinition (`a ´enoncer) puisque le mod`ele est r´egulier, ce qui donne apr`es calculs I(λ) = 1/λ2.
On en conclut que
√n(bλn−λ)−→ ND (0, λ2).
2`eme m´ethode : appliquer le TCL pour v.a.i.i.d. (`a ´enoncer) puis la delta-m´ethode univari´ee (`a ´enoncer)
Le TCL pour v.a.i.i.d. admettant des moments d’ordre 1 et 2 permet d’affirmer que
√n(Xn−E[X])−→ ND (0,Var(X))
soit √
n(Xn−1/λ)−→D Z ∼ N(0,1/λ2).
Appliquons ensuite la delta-m´ethode univari´ee avecg :x→1/xd´erivable surX(Ω) =R∗+
avec g0(x) =−1/x2 :
√n(g(Xn)−g(1/λ))−→D g0(1/λ).Z
soit √
n(bλn−λ)−→ ND (0, λ2).
3. D´eterminons un intervalle de confiance pour λ au niveau de confiance 1−α= 0.95.
1`ere ´etape: d´eterminons une statistique pivotaleTnpourλ. En utilisant ce qui pr´ec`ede, la LFGN et le th´eor`eme de Slutsky, on obtient
Tn=√
nbλn−λ bλn
−→ ND (0,1).
2`eme ´etape : d´eterminons a et b tels que P[a ≤ Tn ≤ b] = 0.95. En r´epartissant le risque de fa¸con sym´etrique, on obtient −a =b= Φ−1(0.975) = 1.96 avec Φ= fonction de r´epartition de la loi N(0,1).
3`eme ´etape : on inverse l’intervalle pr´ec´edent en
P
"
bλn−1.96bλn
√n ≤λ ≤bλn+ 1.96bλn
√n
#
= 0.95
4. On veut estimer p = P[15 ≤ X ≤ 20] = F(20)− F(15) = e−15λ − e−20λ. Proposons pbn =e−15bλn −e−20bλn.
On a d´ej`a fait bλn n→∞−→ λ presque-sˆurement. Comme la fonctiong :x→e−15x−e−20x est continue sur R, on en d´eduit quepbn
n→∞−→ ppresque-sˆurement.
On a d´ej`a fait √
n(bλn−λ) −→ ND (0, λ2). Appliquons la delta-m´ethode avec la fonction g :x→e−15x−e−20x d´erivable sur R etg0(x) = −15e−15x+ 20e−20x, ce qui donne
√n(bpn−p)−→ ND (0, λ2(−15e−15λ+ 20e−20λ)2).
On peut obtenir (d´etailler la m´ethode et les calculs) l’intervalle de confiance pourpa 95%` de niveau de confiance :
P
"
pbn−1.96bλn
√n
−15e−15bλn+ 20e−20bλn
≤p≤pbn+ 1.96bλn
√n
−15e−15bλn + 20e−20bλn
#
= 0.95
5. On veut estimerN = 1000P[X ≤15] = 1000(1−e−15λ). ProposonsNbn= 1000(1−e−15bλn).
On obtient la consistance forte et la convergence en loi comme pr´ec´edemment (`a faire).
On en d´eduit toujours comme pr´ec´edemment (`a faire) l’intervalle de confiance pour N `a 95% de niveau de confiance :
P
"
Nbn−1.96bλn
√n
15000e−15bλn
≤N ≤Nbn+ 1.96bλn
√n
15000e−15bλn
#
= 0.95
Exercice 3.
1. fθ est une densit´e de probabilit´e ssi fθ(x)≥0 pour tout x∈Ret Z
fθ(x)dµ(x) = 1 pour µ mesure dominante du mod`ele qui est ici la mesure de Lebesgue.
2. Eθ[X] = 2
3θ, Varθ(X) = 1
18θ2 etFθ(x) =
0 si x <0 x2
θ2 si 0≤x < θ 1 si x≥θ
.
3. Utilisons la premi`ere d´efinition de l’information de Fisher valable sous les hypoth`eses (H1) et (H2) `a rappeler et `a v´erifier. On obtientI(θ) = 4
θ2. 4. L’estimateur de la m´ethode des moments de θ est eθn= 3
2Xn.
5. L’estimateur de la m´ethode du maximum de vraisemblance deθ estθbn= max(X1, ..., Xn).
6. Eθ[eθn] = θ donc θen est non biais´e, Varθ(eθn) = θ2
8n donc θen est convergent en moyenne quadratique vers θ,Rθ(eθn) = θ2
8n.
D´eterminons la loi de θbn : P[bθn ≤ x] =
0 si x <0 x2n
θ2n si 0≤x < θ 1 si x≥θ
donc la densit´e de la
loi de θbn par rapport `a la mesure de Lebesgue est fbθ
n(x) = 2nx2n+1
θ2n I(0 ≤ x ≤ θ).
On en d´eduit Eθ[bθn] = 2nθ
2n+ 1 donc bθn est biais´e mais asymptotiquement non biais´e, Varθ(bθn) = nθ2
(n+ 1)(2n+ 1)2, Rθ(bθn) = nθ2
(n+ 1)(2n+ 1)2 +θ2
2n 2n+ 1 −1
2
doncθbn est convergent en moyenne quadratique vers θ mais la vitesse de cette convergence est moins rapide que celle de la convergence de θen.
7. Le mod`ele n’est pas r´egulier car X(Ω) d´epend du param`etre `a estimer. La borne de Fr´echet-Darmois-Cramer-Rao ne s’applique donc pas.
8. Le TCL pour v.a.i.i.d. admettant des moments d’ordre 1 et 2 permet d’affirmer
√n(eθn−θ)−→ ND
0,θ2 18
.
La convergence en loi de θbn correctement centr´e et normalis´e s’´etablit `a la main :
P h
n(bθn−θ)≤xi
=
0 si x <−nθ
1 + x nθ
2n
si −nθ≤x <0 1 si x≥0
On en d´eduit
P h
n(bθn−θ)≤xin→∞
−→
(e2x/θ si x <0 1 si x≥0 Ceci montre que
n(bθn−θ)−→ −ZD o`u Z ∼ E
2 θ
. Exercice 4.
1. E[X−Z|Y −X] =−3 doncL(E[X−Z|Y −X]) =δ−3
2. L’ensemble des variables ηa,b,c ind´ependantes de U est caract´eris´e par la relation a= 7b.
3.
Y −X Z−X
∼ N2
−1 3
,
11 0 0 3
4.
Y X Z
∼ N3
1 2 5
,
9 1 −1
1 4 2
−1 2 3
Exercice 5.
1. E[Y|U, V] =aU+bV+c, Var(Y|U, V) = σ2, les covariablesU etV influent sur la moyenne de Y de fa¸con lin´eaire avec une erreur al´eatoire centr´ee.
2. La d´etermination de (ba,bb,bc) estimateur des moindres carr´es de (a, b, c) peut se faire ou bien en annulant le vecteur gradient de Q(a, b, c) =
n
X
i=1
(Yi−aUi−bVi−c)2 et en v´erifiant que la matrice hessienne en la solution obtenue est d´efinie positive ou bien (et c’est mieux) en appliquant le th´eor`eme de projection orthogonale sur un sous-espace vectoriel de Rn. Rappel du th´eor`eme de projection sur un sous espace vectoriel ferm´e d’un espace de Hilbert :
Soit F un sous espace vectoriel ferm´e d’un espace de Hilbert muni d’un produit scalaire h., .i et d’une norme k.k. Alors, pour tout Y de H, il existe un unique point not´e pF(Y) tel que kY−pF(Y)k = inf
U∈FkY−Uk et qui se caract´erise par deux conditions `a savoir (pF(Y)∈F,
Y−pF(Y)∈F⊥.
Quelle que soit la m´ethode employ´ee, on obtient bb = RY VRU2 −RU VRU Y
RV2RU2−(RU V)2 , ba= RU Y
RU2 − RU V
RU2bb, bc=Yn−Unba−Vnbb
en notant
RU2 = (U2)n−(Un)2, RV2 = (V2)n−(Vn)2
RU V = (U V)n−UnVn, RU Y = (U Y)n−UnYn, RV Y = (V Y)n−VnYn et avec
Yn= 1 n
n
X
i=1
Yi, Un= 1 n
n
X
i=1
Ui, Vn = 1 n
n
X
i=1
Vi, (U V)n = 1 n
n
X
i=1
UiVi
(U Y)n= 1 n
n
X
i=1
UiYi, (V Y)n = 1 n
n
X
i=1
ViYi, (U2)n= 1 n
n
X
i=1
Ui2, (V2)n = 1 n
n
X
i=1
Vi2.