HAL Id: hal-01539139
https://hal.archives-ouvertes.fr/hal-01539139
Submitted on 14 Jun 2017
HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
Estimation non paramétrique optimale du taux de saut d’un processus markovien déterministe par morceaux
Romain Azaïs, Aurélie Muller-Gueudin
To cite this version:
Romain Azaïs, Aurélie Muller-Gueudin. Estimation non paramétrique optimale du taux de saut
d’un processus markovien déterministe par morceaux. 48èmes journées de Statistique de la SFDS,
Montpellier, May 2016, Montpellier, France. �hal-01539139�
Estimation non param´ etrique optimale du taux de saut d’un processus markovien d´ eterministe par
morceaux
Romain Aza¨ıs & Aur´ elie Muller-Gueudin
Inria Nancy-Grand Est, Team BIGS, Institut ´ Elie Cartan de Lorraine, Vandoeuvre-l` es-Nancy, France
romain.azais@inria.fr & aurelie.gueudin@univ-lorraine.fr
R´ esum´ e. Un processus markovien d´ eterministe par morceaux est un processus stochas- tique dont la trajectoire est d´ ecrite par une ´ equation diff´ erentielle perturb´ ee par des sauts al´ eatoires en des instants al´ eatoires. Nous nous int´ eressons ` a l’estimation du taux de saut d’un tel processus observ´ e en temps long sous une hypoth` ese d’ergodicit´ e. Nous in- troduisons une classe d’estimateurs non param´ etriques consistants et asymptotiquement gaussiens. Nous proposons de choisir l’estimateur de variance minimale, variance qui est elle-mˆ eme ` a estimer.
Mots-cl´ es. taux de saut, m´ ethode ` a noyau, estimation non param´ etrique, processus markovien d´ eterministe par morceaux
Abstract. A piecewise-deterministic Markov process is a stochastic process whose behavior is governed by an ordinary differential equation punctuated by random jumps occurring at random times. We focus on the nonparametric estimation problem of the jump rate for such a stochastic model observed within a long time interval under an ergod- icity condition. We introduce an uncountable class of kernel estimates of the jump rate and we establish their strong pointwise consistency as well as their asymptotic normality.
We propose to choose among this class the estimator with the minimal variance, which is unfortunately unknown and thus remains to be estimated.
Keywords. jump rate, kernel method, nonparametric estimation, piecewise-determi- nistic Markov process
1 Introduction
Les processus markoviens d´ eterministes par morceaux (PDMP pour l’anglais Piecewise-
Deterministic Markov Processes) ont ´ et´ e introduits par Davis [5] dans les ann´ ees 1980
comme une large classe de mod` eles stochastiques ` a temps continu non diffusifs. Ils appa-
raissent dans de nombreuses applications, notamment en biologie [2, 4, 8, 9], en neuro-
sciences [7], et en fiabilit´ e [3, 6]. D` es lors se pose la question de l’estimation des param` etres
d’un tel processus ` a partir d’une ou plusieurs observations.
La trajectoire d’un PDMP (X
t) sur un ouvert E de ( R
d, B( R
d)) est d´ efinie ` a partir de ses trois caract´ eristiques locales (λ, Q, Φ) :
• Φ : R
d× R → R
dest le flot d´ eterministe ;
• λ : R
d→ R
+est le taux de saut ;
• Q : ( R
d, B( R
d)) → [0, 1] est le noyau de transition.
Nous introduisons les temps de sortie de E pour le flot et le flot parcouru ` a rebours : pour tout x ∈ E,
t
+(x) = inf {t > 0 : Φ(x, t) ∈ ∂E} et t
−(x) = inf {t > 0 : Φ(x, −t) ∈ ∂E} . Nous supposons que ces caract´ eristiques satisfont les conditions usuelles [5, (24.8)]. Par- tant d’une condition initiale X
0= x, la trajectoire de (X
t) est d´ ecrite comme suit. Le premier temps de saut est d´ efini par sa fonction de survie,
∀ t ≥ 0, P (T
1> t | X
0= x) = exp
− Z
t0
λ ◦ Φ(x, s) ds
I
{t<t+(x)}.
La trajectoire entre 0 et le premier temps de saut T
1est donn´ ee par,
∀ 0 ≤ t ≤ T
1, X
t=
Φ(x, t) si t < T
1, Z
1sinon.
o` u la variable al´ eatoire Z
1est d´ efinie via le noyau de transition Q : pour toute fonction mesurable born´ ee ϕ,
E
ϕ(Z
1)
T
1, X
0= x
= Z
ϕ(u) Q(Φ(x, T
1), du).
Partant de la position X
T1, le temps de parcours S
2= T
2− T
1et la future position Z
2sont obtenus de la mˆ eme mani` ere, et ainsi de suite. On obtient un processus ` a temps continu (X
t) ponctu´ e par des sauts ayant lieu aux instants T
n. Les temps de parcours du flot sont les S
n= T
n− T
n−1. Enfin, les positions lors des sauts sont les Z
n= X
Tn.
Il est important de remarquer que la suite (Z
n) forme une chaˆıne de Markov. L’hypoth` ese principale que nous faisons dans la suite concerne l’ergodicit´ e de ce processus. Nous im- posons ´ egalement des conditions de r´ egularit´ e des diff´ erentes caract´ eristiques du mod` ele.
Le noyau Q est suppos´ e ˆ etre ` a densit´ e par rapport ` a la mesure de Lebesgue. Enfin, une hypoth` ese de m´ elange de la chaˆıne de Markov (Z
n) assure la normalit´ e asymptotique de l’estimateur. Nous encourageons le lecteur ` a se r´ ef´ erer ` a [1] pour de plus amples d´ etails.
Nous nous int´ eressons d´ esormais ` a l’estimation du taux λ ` a partir de l’observation en
temps long d’une seule trajectoire du processus lors des instants de saut. Nous avons
donc acc` es ` a la suite des positions Z
net aux temps de parcours S
n.
2 Proc´ edure d’estimation
La fonction compos´ ee λ ◦ Φ(x, t) d´ ecrit le taux d’apparition de la dur´ ee S
n+1en t partant de Z
n= x. C’est ` a cette quantit´ e que nous avons facilement acc` es. Nous proposons de l’estimer ainsi
λ [ ◦ Φ
n(x, t) = P
n−1i=0 1 vidwi
K
d Zi−x viK
1 Si+1−t wiP
n−1i=0 1 vid
K
d Zi−x viI
{Si+1>t},
o` u K
pest une fonction noyau sur R
p, et o` u les fenˆ etres sont d´ efinies pour tout entier k par v
k= v
0(k + 1)
−αet w
k= w
0(k + 1)
−β. Les noyaux K
1et K
ddoivent satisfaire un certain nombre d’hypoth` eses de r´ egularit´ e que nous ne d´ etaillons pas ici. Les param` etres α et β admissibles sont donn´ es par
A =
(α, β) ∈ R
2: α > 0, β > 0, αd + β < 1, αd + β + 2 min(α, β) > 1 . Notre r´ esultat principal, obtenu via la th´ eorie des martingales vectorielles, est le suivant.
Th´ eor` eme. Pour tout couple (x, t) charg´ e par la loi invariante de (Z
n, S
n+1), pour tout (α, β) ∈ A, il existe des fenˆ etres initiales v
0et w
0telles que
λ [ ◦ Φ
n(x, t) −→
p.s.λ ◦ Φ(x, t), et
n
1−αd−β2λ [ ◦ Φ
n(x, t) − λ ◦ Φ(x, t)
L−→ N
0, τ
12τ
d2λ ◦ Φ(x, t) (1 + αd + β)Γ(x, t)
o` u τ
p2= R
Rp
K
2pdλ
p.
Ce r´ esultat est int´ eressant mais ne r´ epond pas pleinement ` a la question de l’estimation du taux λ(x) en un point x ∈ E. Soit C
xla courbe d´ ecrite par le flot parcouru ` a rebours partant de x,
C
x= {Φ(x, −t) : 0 ≤ t < t
−(x)}.
Alors, pour tout ´ el´ ement ξ de la courbe, il existe un unique temps τ
x(ξ) tel que Φ(ξ, τ
x(ξ)) = x.
Par cons´ equent, quelque soit le point ξ ∈ C
x, on a λ ◦ Φ(ξ, τ
x(ξ)) = λ(x).
Cette remarque nous permet de construire une famille d’estimateurs b λ
nξ(x) de λ(x) indic´ es par les ´ el´ ements ξ de C
x,
∀ ξ ∈ C
x, b λ
nξ(x) = λ [ ◦ Φ
n(ξ, τ
x(ξ)).
De plus quelque soit l’indice ξ choisi, nous avons b λ
nξ(x) −→
p.s.λ(x) et n
1−αd−β2b λ
nξ(x) − λ(x)
L−→ N 0, σ
2ξ(x) ,
o` u la variance asymptotique est donn´ ee par
σ
ξ2(x) = τ
12τ
d2λ(x)
(1 + αd + β)Γ(ξ, τ
x(ξ)) .
Nous choisissons donc d’approcher λ(x) par l’estimateur b λ
nξ(x) de variance minimale.
Cela revient ` a d´ eterminer l’´ el´ ement ξ de la courbe qui maximise la quantit´ e Γ(ξ, τ
x(ξ)).
Malheureusement, cette fonction est inconnue et est donc ` a estimer. On propose de l’approcher par,
∀ ξ ∈ C
x, b Γ
n(ξ, τ
x(ξ)) = 1 n
n−1
X
i=0
1 v
diK
dZ
i− x v
iI
{Si+1>τx(ξ)}.
En cons´ equence, nous estimons le taux de saut λ(x) ainsi, b b
λ
n
∗
(x) = b λ
nbξ∗n
(x), o` u ξ b
∗n= arg max
ξ∈Cx
Γ b
nx(ξ, τ
x(ξ)).
Comme souvent, les choix des param` etres de lissage α et β sont cruciaux, en par- ticulier ` a l’´ etape de maximisation (en t´ emoignent les fortes oscillations ou au contraire l’estimation trop lisse lorsque la fenˆ etre est mal choisie). Un crit` ere classique pour choisir ce param` etre est de minimiser le crit` ere ISE (Integrated Square Error en anglais). La validation crois´ ee est une technique populaire pour s´ electionner le param` etre minimisant ce crit` ere. Nous soulignons ici deux difficult´ es : tout d’abord les estimateurs sont calcul´ es
`
a partir de donn´ ees d´ ependantes. De plus, presque sˆ urement, il n’y a aucune donn´ ee sur l’ensemble d’int´ egration du ISE. Nous renvoyons le lecteur ` a notre article [1] dans lequel nous pr´ esentons une m´ ethode ad hoc pour r´ esoudre ce probl` eme.
3 Simulation
Dans cette partie, on consid` ere un PDMP (X
t) ` a valeurs dans E = (0, 1)
2(voir Figure 1). Le flot Φ est d´ efini par, ∀ x = (x
1, x
2) ∈ R
2, ∀ t ∈ R , Φ(x, t) = (x
1+ t, x
2). Le taux de saut λ est d´ efini par, ∀ x ∈ R
2, λ(x) = x
1+ x
2. Enfin, le noyau de transition Q est d´ efini par, ∀ x ∈ E, ∀ A ∈ B(E), Q(x, A) ∝ R
A
u(1 − u)
2/x1−1v(1 − v) du dv. Partant de
(x
1, x
2), le processus ´ evolue dans le carr´ e unit´ e, toujours vers la droite, jusqu’au premier
instant de saut. Cet instant correspond soit ` a l’instant o` u le processus atteint le bord
{(ξ
1, ξ
2) : ξ
1= 1} soit, si le processus saute avant d’atteindre le bord, ` a un instant
al´ eatoire, de taux de saut ´ egal ` a x
1+ x
2+ t, c’est-` a-dire selon une loi de Weibull (voir
Figure 1). Ce mod` ele correspond ` a un processus de type TCP avec environnement utilis´ e pour d´ ecrire le transfert de donn´ ees ` a travers le r´ eseau Internet : la premi` ere composante mod´ elise le nombre de paquets de donn´ ees transmis par unit´ e de temps (les instants de saut correspondent ` a des apparitions de congestion) alors que la seconde dimension mod´ elise la qualit´ e du r´ eseau (la probabilit´ e de congestion est d’autant plus grande que la seconde variable est ´ elev´ ee).
0.0 0.2 0.4 0.6 0.8 1.0
0.00.20.40.60.81.0
First dimension
Second dimension
0 1 2 3 4 5 6
0.00.20.40.60.81.0
Time
First dimension
Figure 1: Deux repr´ esentations de la mˆ eme trajectoire du processus simul´ e jusqu’au 10
`emesaut.
Nous estimons le taux de saut λ au point x = (0.75, 0.5). La classe d’estimateurs de λ(x) est donc index´ ee par les ´ el´ ements ξ ∈ C
x= (0, 0.75] ×{0.5}. Nous observons la chaˆıne de Markov (Z
n, S
n+1) jusqu’au 10 000
`emesaut. Nous pr´ esentons ci-dessous les r´ esultats de nos simulations sur 100 r´ ep´ etitions de l’exp´ erience (voir Figure 2).
0.05 0.15 0.25 0.35 0.45 0.55 0.65 0.75
0.51.01.52.0
Deterministic path
Estimated κ criterion
0.05 0.15 0.25 0.35 0.45 0.55 0.65 0.75
0.00.51.01.52.02.53.0
Deterministic path
Estimation of λ(0.75,0.5)