• Aucun résultat trouvé

Rappel et notations sur les mod`eles d’intensit´e

2.1.1 Introduction - d´efinitions

Soit N

(t) le processus de comptage repr´esentant le nombre d’´ev´enements survenus

sur l’intervalle [0;t], N(t) le processus de comptage repr´esentant le nombre

d’´ev´ene-ments observ´es et Y(t) l’indicateur d’observation (voir notations au chapitre 1,

par-tie 1.1). On note F

t

une filtration engendr´ee au minimum par les processus Y(t) et

N(t) : (F

t

= σ{(N(s), Y(s)); 0 ≤ s ≤ t}). La filtration consid´er´ee peut par ailleurs

inclure l’information apport´ee par des processus de covariables. La filtration F

t

s’in-terpr`ete comme l’histoire, c’est-`a-dire toute l’information accumul´ee jusqu’au tempst.

Les processus N(t) et Y(t) sont alors adapt´es `a la filtration F

t

, c’est-`a-dire qu’ils sont

F

t

-mesurables.

Un processus de comptage est un processus croissant. En cons´equence, c’est une

sous-martingale, c’est-`a-dire un processus tel que :

∀t > s, E(N(t)|F

s

)≥N(s). (2.1)

A ce titre, la d´ecomposition de Doob-Meyer (Doob, 1953; Meyer, 1966) indique que

tout processus de comptage peut se d´ecomposer de fa¸con unique comme la somme d’une

martingaleM(t) et d’un compensateur Λ(t) :

N(t) = Λ(t) +M(t). (2.2)

Le processusM(t) est une martingale par rapport `a la filtrationF

t

, ce qui se traduit

par :

2.1. RAPPEL ET NOTATIONS SUR LES MOD`ELES D’INTENSIT´E 17

Le compensateur Λ(t) est appel´e intensit´e cumul´ee. C’est un processus croissant et

pr´edictible, c’est-`a-dire que sa valeur est connue juste avant l’instant t. Formellement,

une condition suffisante `a la pr´edictibilit´e est que le processus soit adapt´e `a la filtration

F

t

et continu `a gauche. On consid`ere les cas o`u cette intensit´e cumul´ee est absolument

continue. Il existe alors un processus pr´edictible λ(t) tel que :

Λ(t) =

Z

t

0

Y(s)λ(s)ds.

Le processusY(t)λ(t) est appel´e intensit´e du processus de comptage.

L’incr´ement dN(t) du processus de comptage, qui d´esigne le nombre de sauts du

processusN(t) dans l’intervalle [t, t+dt[, se d´ecompose donc en :

dN(t) =Y(t)λ(t)dt+dM(t), (2.3)

o`u dM(t) correspond `a un bruit. La martingale M(t) = R

0t

dM(s) correspond `a un

bruit cumul´e.

L’intensit´eY(t)λ(t) du processusN(t) relativement `a l’histoireF

t

correspond donc

`a :

Y(t)λ(t) = E(dN(t)|F

t

)

dt . (2.4)

Le processusλ(t) est donc d´efini conditionnellement `a l’histoire, le conditionnement

´etant implicite dans la notation : λ(t) est en fait λ(t|F

t

).

Dans l’expression (2.4) de l’intensit´e, l’intervalle de largeurdt est suppos´e

suffisam-ment court pour qu’un seul ´ev´enesuffisam-ment au plus y survienne, et dN(t) est donc ´egal `a 0

ou 1. L’intensit´e peut donc aussi s’´ecrire :

Y(t)λ(t) = P{dN(t) = 1|F

t

}

dt . (2.5)

Sous l’hypoth`ese d’une censure conditionnellement ind´ependante, c’est-`a-dire siY(t)

etdN(t) sont ind´ependants conditionnellement au pass´e, alors si le processus complet

N

(t) est d’intensit´eλ(t), le processus observable N(t) est d’intensit´eY(t)λ(t).

L’inf´erence statistique `a partir de l’intensit´e des processus de comptage s’appuie sur

les propri´et´es des martingales.

Notons qu’en omettant le conditionnement par rapport au pass´e, on peut d´efinir le

mod`ele marginal :

Y(t)ρ(t) = E(dN(t))

dt . (2.6)

On parlera alors de mod`ele sur le«taux»plutˆot que sur l’intensit´e. Pour que la forme du

taux soit conserv´ee en pr´esence de censure, c’est-`a-dire pour que Y(t)ρ(t) corresponde

au taux du processus observ´e lorsque le processus complet N

(t) a un taux ρ(t), il

faut que Y(t) et dN(t) soient ind´ependants. C’est une hypoth`ese plus forte que dans

la mod´elisation de l’intensit´e o`u la censure peut d´ependre du pass´e du processus. La

d´ecomposition (2.3) devient alors :

dN(t) =Y(t)ρ(t)dt+dr(t), (2.7)

etE(dr(t)) = 0.

Par ailleurs,R

0t

dr(s) = N(t)−R

0t

Y(s)ρ(s)dsn’est pas une martingale ce qui implique

une inf´erence diff´erente. Les mod`eles marginaux seront bri`evement abord´es

conjointe-ment avec les mod`eles d’intensit´e canoniques pour lesquels le pass´e n’intervient pas dans

l’intensit´e.

2.1.2 Vraisemblance

On noteτ une dur´ee de suivi maximale (e.g.τ =∞, ouτ = dur´ee totale de l’´etude).

On note C le d´elai de censure du processus (C ≤ τ), et Y(t) = I(t ≤ C) l’indicatrice

d’observation `a l’instantt. La densit´e de probabilit´e associ´ee au r´esultat :k´ev´enements

surviennent aux dates t

1

<· · ·< t

k

est :

L=

k

Y

j=1

λ(t

j

) exp

Z

τ 0

Y(s)λ(s)ds

. (2.8)

Cette expression peut ˆetre obtenue comme un produit de contributions,

condition-nelles au pass´e, sur une partition de petits intervalles (Aalen et al., 2008, p210).

2.1. RAPPEL ET NOTATIONS SUR LES MOD`ELES D’INTENSIT´E 19

En consid´erant un ensemble de n processus individuels associ´es `a n sujets, la

vrai-semblance est alors le produit de contributions individuelles de la forme (2.8).

Dans le cadre d’une mod´elisation o`u l’intensit´e λ(t) est exprim´ee en fonction de

param`etres `a estimer, l’inf´erence sur ces param`etres `a partir de la vraisemblance (2.8)

repose sur l’hypoth`ese d’une censure ind´ependante des ´ev´enements conditionnellement

au pass´e. Dans le cas d’un mod`ele semi-param´etrique, une vraisemblance partielle peut

ˆetre utilis´ee dans le but de s’affranchir d’une sp´ecification du risque de base, ainsi qu’on

le verra par la suite.

2.1.3 Mod`eles de r´egression

Notons x(t) un vecteur de covariables externes, ´eventuellement d´ependantes du

temps. On suppose souvent un effet multiplicatif des covariables sur l’intensit´e :

λ(t) =λ

0

(t)g(x(t),β),

o`uλ

0

(t) est l’intensit´e de base. Le plus souvent on utilise g(x(t),β) = exp{β

t

x(t)}.

Dans un mod`ele d’intensit´e visant `a estimer l’effet de covariables, la d´ependance de

l’intensit´e par rapport au processus histoire doit ˆetre sp´ecifi´ee. Selon l’´echelle de temps

choisie, les mod`eles sp´ecifi´es g´en´eralisent l’un de deux mod`eles canoniques : les mod`eles

de Poisson et les mod`eles correspondant `a des processus de renouvellement.

Les mod`eles de Poisson supposent que l’intensit´e (2.5) ne d´epend pas des ´ev´enements

pr´ec´edents mais seulement de t, et sont donc formul´es en ´echelle de temps calendaire.

Les processus de renouvellement quant `a eux supposent que l’intensit´e ne d´epend

que du temps ´ecoul´e depuis le dernier ´ev´enement, et sont donc formul´es dans une ´echelle

de temps par intervalles :

λ(t) =h(t−T

N(t)

). (2.9)

Les temps d’attente entre ´ev´enements successifs sont alors ind´ependants et

identique-ment distribu´es, ce qui exclut l’inclusion de covariables d´ependantes du temps.