Estimation non paramétrique optimale du taux de saut d'un processus markovien déterministe par morceaux

(1)

HAL Id: hal-01539139

https://hal.archives-ouvertes.fr/hal-01539139

Submitted on 14 Jun 2017

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Estimation non paramétrique optimale du taux de saut d’un processus markovien déterministe par morceaux

Romain Azaïs, Aurélie Muller-Gueudin

To cite this version:

Romain Azaïs, Aurélie Muller-Gueudin. Estimation non paramétrique optimale du taux de saut

d’un processus markovien déterministe par morceaux. 48èmes journées de Statistique de la SFDS,

Montpellier, May 2016, Montpellier, France. �hal-01539139�

(2)

Estimation non param´ etrique optimale du taux de saut d’un processus markovien d´ eterministe par

morceaux

Romain Aza¨ıs & Aur´ elie Muller-Gueudin

Inria Nancy-Grand Est, Team BIGS, Institut ´ Elie Cartan de Lorraine, Vandoeuvre-l` es-Nancy, France

romain.azais@inria.fr & aurelie.gueudin@univ-lorraine.fr

R´ esum´ e. Un processus markovien d´ eterministe par morceaux est un processus stochas- tique dont la trajectoire est d´ ecrite par une ´ equation diff´ erentielle perturb´ ee par des sauts al´ eatoires en des instants al´ eatoires. Nous nous int´ eressons ` a l’estimation du taux de saut d’un tel processus observ´ e en temps long sous une hypoth` ese d’ergodicit´ e. Nous introduisons une classe d’estimateurs non param´ etriques consistants et asymptotiquement gaussiens. Nous proposons de choisir l’estimateur de variance minimale, variance qui est elle-mˆ eme ` a estimer.

Mots-cl´ es. taux de saut, m´ ethode ` a noyau, estimation non param´ etrique, processus markovien d´ eterministe par morceaux

Abstract. A piecewise-deterministic Markov process is a stochastic process whose behavior is governed by an ordinary differential equation punctuated by random jumps occurring at random times. We focus on the nonparametric estimation problem of the jump rate for such a stochastic model observed within a long time interval under an ergod- icity condition. We introduce an uncountable class of kernel estimates of the jump rate and we establish their strong pointwise consistency as well as their asymptotic normality.

We propose to choose among this class the estimator with the minimal variance, which is unfortunately unknown and thus remains to be estimated.

Keywords. jump rate, kernel method, nonparametric estimation, piecewise-deterministic Markov process

1 Introduction

Les processus markoviens d´ eterministes par morceaux (PDMP pour l’anglais Piecewise-

Deterministic Markov Processes) ont ´ et´ e introduits par Davis [5] dans les ann´ ees 1980

comme une large classe de mod` eles stochastiques ` a temps continu non diffusifs. Ils appa-

raissent dans de nombreuses applications, notamment en biologie [2, 4, 8, 9], en neuro-

sciences [7], et en fiabilit´ e [3, 6]. D` es lors se pose la question de l’estimation des param` etres

d’un tel processus ` a partir d’une ou plusieurs observations.

(3)

La trajectoire d’un PDMP (X

_t

) sur un ouvert E de ( R

^d

, B( R

^d

)) est d´ efinie ` a partir de ses trois caract´ eristiques locales (λ, Q, Φ) :

• Φ : R

^d

× R → R

^d

est le flot d´ eterministe ;

• λ : R

^d

→ R

+

est le taux de saut ;

• Q : ( R

^d

, B( R

^d

)) → [0, 1] est le noyau de transition.

Nous introduisons les temps de sortie de E pour le flot et le flot parcouru ` a rebours : pour tout x ∈ E,

t

⁺

(x) = inf {t > 0 : Φ(x, t) ∈ ∂E} et t

⁻

(x) = inf {t > 0 : Φ(x, −t) ∈ ∂E} . Nous supposons que ces caract´ eristiques satisfont les conditions usuelles [5, (24.8)]. Par- tant d’une condition initiale X

₀

= x, la trajectoire de (X

_t

) est d´ ecrite comme suit. Le premier temps de saut est d´ efini par sa fonction de survie,

∀ t ≥ 0, P (T

1

> t | X

0

= x) = exp

− Z

t

0

λ ◦ Φ(x, s) ds

I

^{t<t⁺^(x)}

.

La trajectoire entre 0 et le premier temps de saut T

₁

est donn´ ee par,

∀ 0 ≤ t ≤ T

₁

, X

_t

=

Φ(x, t) si t < T

₁

, Z

1

sinon.

o` u la variable al´ eatoire Z

₁

est d´ efinie via le noyau de transition Q : pour toute fonction mesurable born´ ee ϕ,

E

ϕ(Z

₁

)

T

₁

, X

₀

= x

= Z

ϕ(u) Q(Φ(x, T

₁

), du).

Partant de la position X

_T₁

, le temps de parcours S

₂

= T

₂

− T

₁

et la future position Z

₂

sont obtenus de la mˆ eme mani` ere, et ainsi de suite. On obtient un processus ` a temps continu (X

_t

) ponctu´ e par des sauts ayant lieu aux instants T

_n

. Les temps de parcours du flot sont les S

_n

= T

_n

− T

n−1

. Enfin, les positions lors des sauts sont les Z

_n

= X

_T_n

.

Il est important de remarquer que la suite (Z

n

) forme une chaˆıne de Markov. L’hypoth` ese principale que nous faisons dans la suite concerne l’ergodicit´ e de ce processus. Nous im- posons ´ egalement des conditions de r´ egularit´ e des diff´ erentes caract´ eristiques du mod` ele.

Le noyau Q est suppos´ e ˆ etre ` a densit´ e par rapport ` a la mesure de Lebesgue. Enfin, une hypoth` ese de m´ elange de la chaˆıne de Markov (Z

_n

) assure la normalit´ e asymptotique de l’estimateur. Nous encourageons le lecteur ` a se r´ ef´ erer ` a [1] pour de plus amples d´ etails.

Nous nous int´ eressons d´ esormais ` a l’estimation du taux λ ` a partir de l’observation en

temps long d’une seule trajectoire du processus lors des instants de saut. Nous avons

donc acc` es ` a la suite des positions Z

_n

et aux temps de parcours S

_n

.

(4)

2 Proc´ edure d’estimation

La fonction compos´ ee λ ◦ Φ(x, t) d´ ecrit le taux d’apparition de la dur´ ee S

n+1

en t partant de Z

_n

= x. C’est ` a cette quantit´ e que nous avons facilement acc` es. Nous proposons de l’estimer ainsi

λ [ ◦ Φ

ⁿ

(x, t) = P

n−1

i=0 1 v_i^dwi

K

d

Zi−x vi

K

1

Si+1−t wi

P

n−1

i=0 1 v_i^d

K

d

Zi−x vi

I

{Si+1>t}

,

o` u K

^p

est une fonction noyau sur R

^p

, et o` u les fenˆ etres sont d´ efinies pour tout entier k par v

_k

= v

₀

(k + 1)

^−α

et w

_k

= w

₀

(k + 1)

^−β

. Les noyaux K

1

et K

d

doivent satisfaire un certain nombre d’hypoth` eses de r´ egularit´ e que nous ne d´ etaillons pas ici. Les param` etres α et β admissibles sont donn´ es par

A =

(α, β) ∈ R

²

: α > 0, β > 0, αd + β < 1, αd + β + 2 min(α, β) > 1 . Notre r´ esultat principal, obtenu via la th´ eorie des martingales vectorielles, est le suivant.

Th´ eor` eme. Pour tout couple (x, t) charg´ e par la loi invariante de (Z

_n

, S

_n+1

), pour tout (α, β) ∈ A, il existe des fenˆ etres initiales v

₀

et w

₀

telles que

λ [ ◦ Φ

ⁿ

(x, t) −→

^p.s.

λ ◦ Φ(x, t), et

n

^1−αd−β²

λ [ ◦ Φ

ⁿ

(x, t) − λ ◦ Φ(x, t)

_L

−→ N

0, τ

₁²

τ

_d²

λ ◦ Φ(x, t) (1 + αd + β)Γ(x, t)

o` u τ

_p²

= R

R^p

K

²p

dλ

_p

.

Ce r´ esultat est int´ eressant mais ne r´ epond pas pleinement ` a la question de l’estimation du taux λ(x) en un point x ∈ E. Soit C

_x

la courbe d´ ecrite par le flot parcouru ` a rebours partant de x,

C

_x

= {Φ(x, −t) : 0 ≤ t < t

⁻

(x)}.

Alors, pour tout ´ el´ ement ξ de la courbe, il existe un unique temps τ

_x

(ξ) tel que Φ(ξ, τ

_x

(ξ)) = x.

Par cons´ equent, quelque soit le point ξ ∈ C

_x

, on a λ ◦ Φ(ξ, τ

x

(ξ)) = λ(x).

Cette remarque nous permet de construire une famille d’estimateurs b λ

ⁿ_ξ

(x) de λ(x) indic´ es par les ´ el´ ements ξ de C

_x

,

∀ ξ ∈ C

_x

, b λ

ⁿ_ξ

(x) = λ [ ◦ Φ

ⁿ

(ξ, τ

_x

(ξ)).

(5)

De plus quelque soit l’indice ξ choisi, nous avons b λ

ⁿ_ξ

(x) −→

^p.s.

λ(x) et n

^1−αd−β²

b λ

ⁿ_ξ

(x) − λ(x)

_L

−→ N 0, σ

²_ξ

(x) ,

o` u la variance asymptotique est donn´ ee par

σ

_ξ²

(x) = τ

₁²

τ

_d²

λ(x)

(1 + αd + β)Γ(ξ, τ

_x

(ξ)) .

Nous choisissons donc d’approcher λ(x) par l’estimateur b λ

ⁿ_ξ

(x) de variance minimale.

Cela revient ` a d´ eterminer l’´ el´ ement ξ de la courbe qui maximise la quantit´ e Γ(ξ, τ

_x

(ξ)).

Malheureusement, cette fonction est inconnue et est donc ` a estimer. On propose de l’approcher par,

∀ ξ ∈ C

_x

, b Γ

ⁿ

(ξ, τ

_x

(ξ)) = 1 n

n−1

X

i=0

1 v

^d_i

K

d

Z

_i

− x v

i

I

{Si+1>τx(ξ)}

.

En cons´ equence, nous estimons le taux de saut λ(x) ainsi, b b

λ

n

∗

(x) = b λ

ⁿ

bξ_∗ⁿ

(x), o` u ξ b

_∗ⁿ

= arg max

ξ∈Cx

Γ b

ⁿ_x

(ξ, τ

_x

(ξ)).

Comme souvent, les choix des param` etres de lissage α et β sont cruciaux, en par- ticulier ` a l’´ etape de maximisation (en t´ emoignent les fortes oscillations ou au contraire l’estimation trop lisse lorsque la fenˆ etre est mal choisie). Un crit` ere classique pour choisir ce param` etre est de minimiser le crit` ere ISE (Integrated Square Error en anglais). La validation crois´ ee est une technique populaire pour s´ electionner le param` etre minimisant ce crit` ere. Nous soulignons ici deux difficult´ es : tout d’abord les estimateurs sont calcul´ es

`

a partir de donn´ ees d´ ependantes. De plus, presque sˆ urement, il n’y a aucune donn´ ee sur l’ensemble d’int´ egration du ISE. Nous renvoyons le lecteur ` a notre article [1] dans lequel nous pr´ esentons une m´ ethode ad hoc pour r´ esoudre ce probl` eme.

3 Simulation

Dans cette partie, on consid` ere un PDMP (X

_t

) ` a valeurs dans E = (0, 1)

²

(voir Figure 1). Le flot Φ est d´ efini par, ∀ x = (x

₁

, x

₂

) ∈ R

²

, ∀ t ∈ R , Φ(x, t) = (x

₁

+ t, x

₂

). Le taux de saut λ est d´ efini par, ∀ x ∈ R

²

, λ(x) = x

₁

+ x

₂

. Enfin, le noyau de transition Q est d´ efini par, ∀ x ∈ E, ∀ A ∈ B(E), Q(x, A) ∝ R

A

u(1 − u)

^2/x¹⁻¹

v(1 − v) du dv. Partant de

(x

₁

, x

₂

), le processus ´ evolue dans le carr´ e unit´ e, toujours vers la droite, jusqu’au premier

instant de saut. Cet instant correspond soit ` a l’instant o` u le processus atteint le bord

{(ξ

₁

, ξ

₂

) : ξ

₁

= 1} soit, si le processus saute avant d’atteindre le bord, ` a un instant

al´ eatoire, de taux de saut ´ egal ` a x

₁

+ x

₂

+ t, c’est-` a-dire selon une loi de Weibull (voir

(6)

Figure 1). Ce mod` ele correspond ` a un processus de type TCP avec environnement utilis´ e pour d´ ecrire le transfert de donn´ ees ` a travers le r´ eseau Internet : la premi` ere composante mod´ elise le nombre de paquets de donn´ ees transmis par unit´ e de temps (les instants de saut correspondent ` a des apparitions de congestion) alors que la seconde dimension mod´ elise la qualit´ e du r´ eseau (la probabilit´ e de congestion est d’autant plus grande que la seconde variable est ´ elev´ ee).

0.0 0.2 0.4 0.6 0.8 1.0

0.00.20.40.60.81.0

First dimension

Second dimension

0 1 2 3 4 5 6

0.00.20.40.60.81.0

Time

First dimension

Figure 1: Deux repr´ esentations de la mˆ eme trajectoire du processus simul´ e jusqu’au 10

^`^eme

saut.

Nous estimons le taux de saut λ au point x = (0.75, 0.5). La classe d’estimateurs de λ(x) est donc index´ ee par les ´ el´ ements ξ ∈ C

_x

= (0, 0.75] ×{0.5}. Nous observons la chaˆıne de Markov (Z

n

, S

n+1

) jusqu’au 10 000

^`^eme

saut. Nous pr´ esentons ci-dessous les r´ esultats de nos simulations sur 100 r´ ep´ etitions de l’exp´ erience (voir Figure 2).

0.05 0.15 0.25 0.35 0.45 0.55 0.65 0.75

0.51.01.52.0

Deterministic path

Estimated κ criterion

0.05 0.15 0.25 0.35 0.45 0.55 0.65 0.75

0.00.51.01.52.02.53.0

Deterministic path

Estimation of λ(0.75,0.5)

Figure 2: L’indice optimal ξ b

_∗ⁿ

est calcul´ e en maximisant le crit` ere propos´ e (` a gauche).

L’estimateur b λ

ⁿ_ξ

(x) est calcul´ e pour diff´ erentes valeurs de ξ (` a droite). En couleur, les

estimateurs s´ electionn´ es ξ = ξ b

_∗ⁿ

correspondent au meilleur choix ` a la fois en terme de

biais et variance.

(7)

Bibliographie

[1] R. Aza¨ıs, A. Muller-Gueudin, Optimal choice among a class of nonparametric estima- tors of the jump rate for piecewise-deterministic Markov processes, (2015), Preprint hal-01168651.

[2] P. Bertail, S. Clemen¸con, J. Tressou, Statistical analysis of a dynamic model for dietary contaminant exposure, (2010), Journal of Biological Dynamics, 4(2), pp 212- 234.

[3] J. Chiquet, N. Limnios, A method to compute the transition function of a piecewise deterministic Markov process with application to reliability, (2008), Statistics &

Probability Letters, 78(12), pp1397-1403.

[4] A. Crudu, A. Debussche, A. Muller, O. Radulescu, Convergence of stochastic gene networks to hybrid piecewise deterministic processes, (2012), The Annals of Applied Probability, 22(5).

[5] M. H. A. Davis, Markov models and optimization, Chapman & Hall, 1993.

[6] B. de Saporta, F. Dufour, H. Zhang, C. Elegbede, Optimal stopping for the pre- dictive maintenance of a structure subject to corrosion, (2012) Journal of Risk and Reliability, 226(2), pp169-181.

[7] A. Genadot, M. Thieullen, Averaging for a fully coupled piecewise-deterministic Markov process in infinite dimensions, (2012), Advances in Applied Probability, 44(3), pp 749-773.

[8] O. Radulescu, A. Muller, A. Crudu, Th´ eor` emes limites pour les processus de Markov

`

a sauts, (2007), Technique et Science Informatiques, 26(3-4), pp443-469.

[9] L. Robert, M. Hoffmann, N. Krell S. Aymerich, J. Robert, M. Doumic, Division

in Escherichia coli is triggered by a size-sensing rather than a timing mechanism,

(2014), BMC Biology, 12(1).