2.1.1 Introduction - d´efinitions
Soit N
∗(t) le processus de comptage repr´esentant le nombre d’´ev´enements survenus
sur l’intervalle [0;t], N(t) le processus de comptage repr´esentant le nombre
d’´ev´ene-ments observ´es et Y(t) l’indicateur d’observation (voir notations au chapitre 1,
par-tie 1.1). On note F
tune filtration engendr´ee au minimum par les processus Y(t) et
N(t) : (F
t= σ{(N(s), Y(s)); 0 ≤ s ≤ t}). La filtration consid´er´ee peut par ailleurs
inclure l’information apport´ee par des processus de covariables. La filtration F
ts’in-terpr`ete comme l’histoire, c’est-`a-dire toute l’information accumul´ee jusqu’au tempst.
Les processus N(t) et Y(t) sont alors adapt´es `a la filtration F
t, c’est-`a-dire qu’ils sont
F
t-mesurables.
Un processus de comptage est un processus croissant. En cons´equence, c’est une
sous-martingale, c’est-`a-dire un processus tel que :
∀t > s, E(N(t)|F
s)≥N(s). (2.1)
A ce titre, la d´ecomposition de Doob-Meyer (Doob, 1953; Meyer, 1966) indique que
tout processus de comptage peut se d´ecomposer de fa¸con unique comme la somme d’une
martingaleM(t) et d’un compensateur Λ(t) :
N(t) = Λ(t) +M(t). (2.2)
Le processusM(t) est une martingale par rapport `a la filtrationF
t, ce qui se traduit
par :
2.1. RAPPEL ET NOTATIONS SUR LES MOD`ELES D’INTENSIT´E 17
Le compensateur Λ(t) est appel´e intensit´e cumul´ee. C’est un processus croissant et
pr´edictible, c’est-`a-dire que sa valeur est connue juste avant l’instant t. Formellement,
une condition suffisante `a la pr´edictibilit´e est que le processus soit adapt´e `a la filtration
F
tet continu `a gauche. On consid`ere les cas o`u cette intensit´e cumul´ee est absolument
continue. Il existe alors un processus pr´edictible λ(t) tel que :
Λ(t) =
Z
t0
Y(s)λ(s)ds.
Le processusY(t)λ(t) est appel´e intensit´e du processus de comptage.
L’incr´ement dN(t) du processus de comptage, qui d´esigne le nombre de sauts du
processusN(t) dans l’intervalle [t, t+dt[, se d´ecompose donc en :
dN(t) =Y(t)λ(t)dt+dM(t), (2.3)
o`u dM(t) correspond `a un bruit. La martingale M(t) = R
0tdM(s) correspond `a un
bruit cumul´e.
L’intensit´eY(t)λ(t) du processusN(t) relativement `a l’histoireF
t−correspond donc
`a :
Y(t)λ(t) = E(dN(t)|F
t−)
dt . (2.4)
Le processusλ(t) est donc d´efini conditionnellement `a l’histoire, le conditionnement
´etant implicite dans la notation : λ(t) est en fait λ(t|F
t−).
Dans l’expression (2.4) de l’intensit´e, l’intervalle de largeurdt est suppos´e
suffisam-ment court pour qu’un seul ´ev´enesuffisam-ment au plus y survienne, et dN(t) est donc ´egal `a 0
ou 1. L’intensit´e peut donc aussi s’´ecrire :
Y(t)λ(t) = P{dN(t) = 1|F
t−}
dt . (2.5)
Sous l’hypoth`ese d’une censure conditionnellement ind´ependante, c’est-`a-dire siY(t)
etdN(t) sont ind´ependants conditionnellement au pass´e, alors si le processus complet
N
∗(t) est d’intensit´eλ(t), le processus observable N(t) est d’intensit´eY(t)λ(t).
L’inf´erence statistique `a partir de l’intensit´e des processus de comptage s’appuie sur
les propri´et´es des martingales.
Notons qu’en omettant le conditionnement par rapport au pass´e, on peut d´efinir le
mod`ele marginal :
Y(t)ρ(t) = E(dN(t))
dt . (2.6)
On parlera alors de mod`ele sur le«taux»plutˆot que sur l’intensit´e. Pour que la forme du
taux soit conserv´ee en pr´esence de censure, c’est-`a-dire pour que Y(t)ρ(t) corresponde
au taux du processus observ´e lorsque le processus complet N
∗(t) a un taux ρ(t), il
faut que Y(t) et dN(t) soient ind´ependants. C’est une hypoth`ese plus forte que dans
la mod´elisation de l’intensit´e o`u la censure peut d´ependre du pass´e du processus. La
d´ecomposition (2.3) devient alors :
dN(t) =Y(t)ρ(t)dt+dr(t), (2.7)
etE(dr(t)) = 0.
Par ailleurs,R
0tdr(s) = N(t)−R
0tY(s)ρ(s)dsn’est pas une martingale ce qui implique
une inf´erence diff´erente. Les mod`eles marginaux seront bri`evement abord´es
conjointe-ment avec les mod`eles d’intensit´e canoniques pour lesquels le pass´e n’intervient pas dans
l’intensit´e.
2.1.2 Vraisemblance
On noteτ une dur´ee de suivi maximale (e.g.τ =∞, ouτ = dur´ee totale de l’´etude).
On note C le d´elai de censure du processus (C ≤ τ), et Y(t) = I(t ≤ C) l’indicatrice
d’observation `a l’instantt. La densit´e de probabilit´e associ´ee au r´esultat :k´ev´enements
surviennent aux dates t
1<· · ·< t
kest :
L=
kY
j=1λ(t
j) exp
−
Z
τ 0Y(s)λ(s)ds
. (2.8)
Cette expression peut ˆetre obtenue comme un produit de contributions,
condition-nelles au pass´e, sur une partition de petits intervalles (Aalen et al., 2008, p210).
2.1. RAPPEL ET NOTATIONS SUR LES MOD`ELES D’INTENSIT´E 19
En consid´erant un ensemble de n processus individuels associ´es `a n sujets, la
vrai-semblance est alors le produit de contributions individuelles de la forme (2.8).
Dans le cadre d’une mod´elisation o`u l’intensit´e λ(t) est exprim´ee en fonction de
param`etres `a estimer, l’inf´erence sur ces param`etres `a partir de la vraisemblance (2.8)
repose sur l’hypoth`ese d’une censure ind´ependante des ´ev´enements conditionnellement
au pass´e. Dans le cas d’un mod`ele semi-param´etrique, une vraisemblance partielle peut
ˆetre utilis´ee dans le but de s’affranchir d’une sp´ecification du risque de base, ainsi qu’on
le verra par la suite.
2.1.3 Mod`eles de r´egression
Notons x(t) un vecteur de covariables externes, ´eventuellement d´ependantes du
temps. On suppose souvent un effet multiplicatif des covariables sur l’intensit´e :
λ(t) =λ
0(t)g(x(t),β),
o`uλ
0(t) est l’intensit´e de base. Le plus souvent on utilise g(x(t),β) = exp{β
tx(t)}.
Dans un mod`ele d’intensit´e visant `a estimer l’effet de covariables, la d´ependance de
l’intensit´e par rapport au processus histoire doit ˆetre sp´ecifi´ee. Selon l’´echelle de temps
choisie, les mod`eles sp´ecifi´es g´en´eralisent l’un de deux mod`eles canoniques : les mod`eles
de Poisson et les mod`eles correspondant `a des processus de renouvellement.
Les mod`eles de Poisson supposent que l’intensit´e (2.5) ne d´epend pas des ´ev´enements
pr´ec´edents mais seulement de t, et sont donc formul´es en ´echelle de temps calendaire.
Les processus de renouvellement quant `a eux supposent que l’intensit´e ne d´epend
que du temps ´ecoul´e depuis le dernier ´ev´enement, et sont donc formul´es dans une ´echelle
de temps par intervalles :
λ(t) =h(t−T
N(t−)). (2.9)
Les temps d’attente entre ´ev´enements successifs sont alors ind´ependants et
identique-ment distribu´es, ce qui exclut l’inclusion de covariables d´ependantes du temps.
Dans le document
Modèles multiplicatifs du risque pour des événements successifs en présence d’hétérogénéité
(Page 41-45)