HAL Id: inria-00494685
https://hal.inria.fr/inria-00494685
Submitted on 24 Jun 2010
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of
sci-entific research documents, whether they are
pub-lished or not. The documents may come from
teaching and research institutions in France or
L’archive ouverte pluridisciplinaire HAL, est
destinée au dépôt et à la diffusion de documents
scientifiques de niveau recherche, publiés ou non,
émanant des établissements d’enseignement et de
recherche français ou étrangers, des laboratoires
Estimation non paramétrique pénalisée de la dérivée de
la densité d’un processus de diffusion
Emeline Schmisser
To cite this version:
Emeline Schmisser. Estimation non paramétrique pénalisée de la dérivée de la densité d’un processus
de diffusion. 42èmes Journées de Statistique, 2010, Marseille, France, France. �inria-00494685�
de la dérivée de la densité d'un pro essus de diffusion
EmelineS hmisser
Laboratoire MAP5 Université Paris Des artes 45, rue des Saints-Pères 75006 Paris
Abstra t Nous onsidérons unpro essusdediusion
(X
t
)
t≥0
defon tion dedériveb
et de oe ient de diusionσ
. Nous supposons quele pro essusest stri tement station-naireetβ
-mélangeant. Cepro essusestobservéàdesinstantsdis retst
k
= k∆
pourk
variant de 0 àn
+ 1
. Nous al ulons deux estimateurs non paramétriques de la dérivéef
′
de ladensité
f
de e pro essus. Pour ela,nous onsidérons une familles de sous-espa es ve toriels et, sur ha un de es sous-espa es, nous al ulons deux estimateurs def
′
,f
ˆ
′(d)
m
etf
ˆ
′(b)
m
. Nous hoisissons ensuiteles deux meilleurs estima-teurspossibles,f
ˆ
′
(d)
ˆ
m
etf
ˆ
′
(b)
ˆ
m
enintroduisant deuxfon tionsdepénalitépen
(d)
(m)
et
pen
(b)
(m)
. Le premier estimateur,ˆ
f
′(d)
m
,estobtenu endérivant un estimateurdef
. Cetestimateur minimiseune fon tion de ontraste. L'estimateur adaptatiff
ˆ
′
(d)
ˆ
m
estonvergent si
n
∆ → ∞
(que le pas∆
soit xé ouqu'il tende vers0). Pour al uler le se ond estimateur, nous supposons que le oe ient de diusionσ
est onstant égalà1. Dans e as,lafon tionf
′
vérie l'égalitéf
′
(x) = 2b(x)f (x)
. L'estimateurˆ
f
′(b)
m
minimiseune fon tionde ontrastebasésur etteégalité. Lorsquelepas∆
est petit, le risquede l'estimateurf
ˆ
(b)
ˆ
m
est plus petit quele risque def
ˆ
′d
ˆ
m
. Cependant, l'estimateurˆ
f
m
(b)
ˆ
ne onverge quesi∆ → 0
etn
∆ → ∞
.Let us onsider a diusion pro ess
(X
t
)
t≥0
of drift fun tionb
and diusion oef- ientσ
. This pro ess is assumed to be stri tly stationary andβ
-mixing. It is observed atdis rete timest
k
= k∆
fork
from 0ton
+ 1
. Twonon parametri esti-matorsofthe derivativef
′
ofthedensityfun tion
f
are omputed. Forthispurpose, we onsider a family of ve torial subspa es and ompute a olle tion of estimators off
′
oneverysubspa e,f
ˆ
′
(d)
m
andf
ˆ
′
(b)
m
. Then,the bestestimatorsf
ˆ
′
(d)
ˆ
m
andf
ˆ
′
(b)
ˆ
m
aresele ted by introdu ing two penalty fun tions,
pen
(d)
(m)
andpen
(b)
(m)
. The rst estimator,f
ˆ
′(d)
m
, is the derivative of an estimator off
. This estimator minimises a ontrast fun tion. The adaptive estimatorf
ˆ
′
(d)
ˆ
m
onverges ifn
∆ → ∞
. In order to omputethese ondestimator, weassumethatthediusion oe ientσ
is onstant (σ
= 1
). Inthat ase, thefun tionf
′
satisesthe equality
f
′
(x) = 2b(x)f (x)
. The estimator
ˆ
f
′(b)
m
minimises a ontrast fun tion based on this equality. If∆
issmall, theriskof the estimatoroff
ˆ
′
(b)
ˆ
m
issmaller than therisk off
ˆ
′
(d)
ˆ
1 Notations
Considéronsl'équation diérentielle sto hastique
dX
t
= b(X
t
)dt + dW
t
,
X
0
= η
Lepro essus
(X
t
)
t≥0
est supposé stri tementstationnaireetβ
−
mélangeantde oe ient deβ
-mélangeβ
X
(t) ≤ ce
−θt
. Notons
f
ladensitéstationnairede(X
t
)
. Nousobservons e pro essus à des instants dis retst
= 0, ∆, . . . , n∆
. Nous voulons estimer la dérive de la fon tion de densitéf
′
sur l'intervalle
[0, π]
.2 Estimation par dérivée d'un estimateur
Dans ette partie, nous onstruisons un estimateur
f
ˆ
′
(d)
m
def
′
en dérivant un estimateur de
f
. Considérons le ontrasteγ
n
(t) = ktk
2
L
2
−
2
n
n
X
i=1
t(X
i
)
etdénissons l'estimateurˆ
f
m
= inf
t∈S
m
{γ
n
(t)}
où
S
m
est un sous-espa eve toriel engendré par les polynmestrigonométriques:S
m
=
Ve tcos(kx)1
[0,π]
(x), 0 ≤ k ≤ m
.
Notonsf
m
la proje tion def
surS
m
. NotonsV
m
=
Ve tsin(kx)1
[0,π]
(x), 1 ≤ k ≤ m
.
Laproje tionf
′
(d)
m
def
′
sur
V
m
=
Ve tsin(kx)1
[0,π]
(x), 1 ≤ k ≤ m
vérie
f
m
′
(b)
= (f
m
)
′
.
Notons
f
ˆ
′
(d)
m
= ( ˆ
f
m
)
′
. Cet estimateur minimise,pourt
∈ V
m
,le ontrasteγ
(d)
n
(t) = ktk
2
L
2
+
2
n
n
X
i=1
t
′
(X
i
).
2.1 Risque de l'estimateur à
m
xé.Notons
M
n
= {m, D
m
≤ D
n
}
. La dimension maximaleD
n
sera pré isée plus loin. Pour toutm
∈ M
n
, nous al ulons l'estimateurf
ˆ
′
(d)
m
def
′
. D'après Pythagore,k ˆ
f
′
(d)
m
− f
′
1
[0,π]
k
2
L
2
= kf
′
(d)
m
− f
′
1
[0,π]
k
2
L
2
+ k ˆ
f
′
(d)
m
− f
′
(d)
m
k
2
L
2
.
De plus, nous avons quek ˆ
f
′
(d)
m
− f
′
(d)
m
k
2
L
2
≤ D
2
m
k ˆ
f
m
− f
m
k
2
L
2
.
Pour majorer ette quantité, nous utilisons des propriétés de
β
-mélange (voir Viennet (1997)).Si lepas
∆
est xe, alors lerisque de l'estimateur vérieE
f
ˆ
′
(d)
m
− f
′
1
[0,π]
2
L
2
≤
f
′
(d)
m
− f
′
1
[0,π]
2
l
2
+ c
D
3
m
n
.
Si
∆ → 0
etn
∆ → ∞
, nous avons queE
f
ˆ
′(d)
m
− f
′
A
2
L
2
≤
f
′
(d)
m
− f
′
A
2
L
2
+ c
D
m
3
nθ
∆
.
2.2 Optimisation du hoix dem
Supposons que
f
appartienne à un espa e de BesovB
α
2,∞
et quekf
′
k
2
B
α
2,∞
≤ 1.
Dans e as, nous avons quef
− f
(d)
m
2
L
2
≤ C(α)D
−
2α
m
,
donf
′
1
[0,π]
− f
′
(d)
m
2
L
2
≤ D
2
m
f
− f
m
(d)
2
L
2
≤ C(α)D
−
2(α−1)
m
.
Pour que le ompromis biais-varian e sois minimal, nous devons hoisir, si le pas
∆
est xe,D
m
∼ n
1/(1+2α)
etdans e as, lerisque de l'estimateur vérie
E
ˆ
f
′
(d)
m
− f
′
1
[0,π]
2
L
2
≤ n
−2(α−1)/(1+2α)
.
Si
∆ → 0
etn
∆ → ∞
, nous devons prendreD
m
∼ (nθ∆)
1/(1+2α)
pour minimiserle ompromis biais-varian e. Dans e as, l'estimateurvérie
E
ˆ
f
′
(d)
m
− f
′
1
[0,π]
2
L
2
≤ (nθ∆)
−
2(α−1)/(1+2α)
.
Introduisons une fon tion de pénalité
pen
(d)
(m)
dépendant deD
m
et den
. Choisissonsˆ
m
telqueˆ
m
= arg min
m∈M
n
h
γ
n
(d)
ˆ
f
′
(d)
m
+ pen
(d)
(m)
i
etnotonsf
ˆ
′
ˆ
m
l'estimateur résultant. Si lepas est xé,quepen
(d)
(m) ≥ c
D
3
m
n
etD
4
n
≤ c ln
2
(n)n exp
c
′
√
n
ln(n)
alorsE
ˆ
f
′
(d)
ˆ
m
− f
′
1
[0,π]
2
L
2
≤ C inf
m∈M
n
f
′
(d)
m
− f
′
1
[0,π]
2
L
2
+ pen
(d)
(m) + c
ln
4
(n)
n
.
Si∆ → 0
etn
∆ → ∞
, quepen
(d)
(m) ≥ c
D
3
m
nθ
∆
etD
4
n
≤ cn∆ ln
2
(n) exp
c
′
√
n∆
ln(n)
!
,
alorsE
f
ˆ
′
(d)
ˆ
m
− ˆ
f
′
1
[0,π]
2
L
2
≤ C inf
m∈M
n
f
′
(d)
m
− f
′
1
[0,π]
2
L
2
+ pen
(d)
(m) +
c
ln
4
(n)
n∆
+
1
n
.
3 Si le oe ient de diusion est onstant
3.1 Modèle et hypothèses
Supposons que
σ
= 1
. Dans e as, la densitéstationnaire vérief
(x) ∝ exp
2
Z
x
0
b
(x)dx
etf
′
(x) = 2b(x)f (x)
. Dans ettepartie,noussupposonsquelafon tionb
estlips hitzienne etqu'il existe des onstantesr >
0
etα
≥ 1
telles que3.2 Risque de l'estimateur à
m
xéConsidérons les espa es ve toriels
S
m
=
Ve t1, (cos(kx))
1≤k≤m
. Pour tout
m
∈ M
n
, aveM
n
= {m, D
m
≤ D
n
}
, nous allons al ulerun estimateurf
ˆ
′
(b)
m
def
′
. La dimension maximale
D
n
sera pré isée plus loin. Notonsf
′
(b)
m
laproje tionorthogonale def
′
surS
m
. Considéronsle ontrasteγ
n
(b)
(t) = ktk
2
L
2
−
4
n
∆
n
X
k=1
X
(k+1)∆
− X
k∆
t (X
k∆
)
etl'estimateurˆ
f
′
(b)
m
= arg min
t∈S
m
γ
n
(b)
(t).
Noussavons que
∆
−
1
X
(k+1)∆
− X
k∆
= I
k∆
+ Z
k∆
+ b(X
k∆
)
aveI
k∆
=
1
∆
Z
(k+1)∆
k∆
(b(X
s
) − b(X
k∆
)) ds
etZ
k∆
=
1
∆
Z
(k+1)∆
k∆
dW
s
.
Donγ
n
(t) − γ
n
(s) = ktk
2
L
2
− ksk
2
L
2
−
4
n
n
X
k=1
(I
k∆
+ Z
k∆
+ b(X
k∆
)) (t(X
k∆
) − s(X
k∆
)) .
De plus, nous avons que
kt − f
′
k
2
L
2
= ktk
2
L
2
+ kf
′
k
2
L
2
− 2
Z
t(x)f
′
(x)dx = ktk
2
L
2
+ kf
′
k
2
L
2
− 4
Z
t(x)b(x)f (x)dx.
Notonsν
n
(t) =
1
n
n
X
k=1
Z
k∆
t
(X
k∆
)
ρ
n
(t) =
1
n
n
X
k=1
E (I
k∆
t(X
k∆
))
ξ
n
(t) =
1
n
n
X
k=1
(I
k∆
+ b(X
k∆
)) t(X
k∆
) − E ((I
k∆
+ b(X
k∆
)) t(X
k∆
))
Nousavons que
f
ˆ
′
(b)
m
− f
′
1
[0,π]
2
= kt − f
′
k
2
L
2
−
f
ˆ
′
(b)
m
− f
′
2
+ 2 (ν
n
+ ρ
n
+ ξ
n
)
ˆ
f
′
(b)
m
− f
′
(b)
m
Lamajoration des termes
ν
n
etρ
n
utilise lespropriétésde ladiusion etest réaliséedans Comteetal(2007). Lamajorationdudernierterme,ξ
n
,utiliseleβ
-mélangeetestréalisée dans Viennet(1997).E
ˆ
f
′
(b)
m
− f
′
1
[0,π]
2
L
2
≤
f
′
(b)
m
− f
′
1
[0,π]
2
L
2
+ c∆ + c
D
m
n∆
3.3 Optimisation du hoix dem
Supposons quef
′
appartienne à la boule unité de l'espa e de Besov
B
α
2,∞
. Dans e as, noussavons quef
′
− f
′
m
(b)
2
L
2
≤ D
−2α
m
. Pourminimiserle ompromisbiais-varian e,nous devons hoisirD
m
∼ (n∆)
1/(1+2α)
etdans e as le risque de l'estimateur vérie:
E
ˆ
f
′
(b)
m
− f
′
2
L
2
≤ C (n∆)
−2α/(1+2α)
+ c∆.
Dalayan et Kutoyants (2003) estiment la dérivée de la densité d'une diusion dans le as où on a des données ontinues. La borne minimax du risque qu'ils trouvent est
c(n∆)
−2α/(1+2α)
.
3.4 Risque de l'estimateur adaptatif Posons
pen
(b)
(m) = c
D
m
n∆
etnotonsˆ
m
= inf
m∈M
n
n
γ
n
ˆ
f
′
(b)
m
+ pen
(b)
(m)
o
etnotons
f
ˆ
m
ˆ
l'estimateur résultant. SiD
2
n
≤ nθ∆
, alorsE
ˆ
f
′
(b)
ˆ
m
− f
′
2
L
2
≤ C inf
m∈M
n
f
′
(b)
m
− f
′
2
L
2
+ pen(m)
+ ∆ + c
ln
2
(n)
n∆
Bibliographie[1℄ Comte, F. genon-Catalot, V. et Rozenhol , Y. (2007) Penalized noparametri mean square estimation of the oe ients of diusion pro esses, Berbouilli,13(2) 514543. [2℄Viennet,G.(1997)Inequalitiesforabsolutelyregularsequen es: appli ationtodensity estimation. Probab. Theory Related Fiels,107(4), 467492.
[3℄ Dalayan, A.S. et Kutoyants, A.Y. (2003) Asymptoti ally E ient Estimation of the Derivative of the Invariant Density Statisti al Inferen e for Sto hasti Pro esses, 6(1), 89107