Récemment recherché

Aucun résultat trouvé

Étiquettes

Aucun résultat trouvé

Document

Aucun résultat trouvé

Accueil Écoles Thèmes

Connexion

Rappel et notations sur les mod`eles d’intensit´e

Dans le document Modèles multiplicatifs du risque pour des événements successifs en présence d’hétérogénéité (Page 41-45)

2.1.1 Introduction - d´efinitions

Soit N

∗

(t) le processus de comptage représentant le nombre d’événements survenus

sur l’intervalle [0;t], N(t) le processus de comptage repr´esentant le nombre

d’événe-ments observés et Y(t) l’indicateur d’observation (voir notations au chapitre 1,

par-tie 1.1). On note F

_t

une filtration engendr´ee au minimum par les processus Y(t) et

N(t) : (F

_t

= σ{(N(s), Y(s)); 0 ≤ s ≤ t}). La filtration consid´er´ee peut par ailleurs

inclure l’information apport´ee par des processus de covariables. La filtration F

_t

s’in-terprète comme l’histoire, c’est-à-dire toute l’information accumulée jusqu’au tempst.

Les processus N(t) et Y(t) sont alors adapt´es `a la filtration F

_t

, c’est-`a-dire qu’ils sont

F

_t

-mesurables.

Un processus de comptage est un processus croissant. En cons´equence, c’est une

sous-martingale, c’est-`a-dire un processus tel que :

∀t > s, E(N(t)|F

_s

)≥N(s). (2.1)

A ce titre, la d´ecomposition de Doob-Meyer (Doob, 1953; Meyer, 1966) indique que

tout processus de comptage peut se d´ecomposer de fa¸con unique comme la somme d’une

martingaleM(t) et d’un compensateur Λ(t) :

N(t) = Λ(t) +M(t). (2.2)

Le processusM(t) est une martingale par rapport `a la filtrationF

_t

, ce qui se traduit

par :

2.1. RAPPEL ET NOTATIONS SUR LES MOD`ELES D’INTENSIT´E 17

Le compensateur Λ(t) est appelé intensité cumulée. C’est un processus croissant et

pr´edictible, c’est-`a-dire que sa valeur est connue juste avant l’instant t. Formellement,

une condition suffisante à la prédictibilité est que le processus soit adapté à la filtration

F

_t

et continu à gauche. On considère les cas où cette intensité cumulée est absolument

continue. Il existe alors un processus pr´edictible λ(t) tel que :

Λ(t) =

Z

t

0

Y(s)λ(s)ds.

Le processusY(t)λ(t) est appel´e intensit´e du processus de comptage.

L’incr´ement dN(t) du processus de comptage, qui d´esigne le nombre de sauts du

processusN(t) dans l’intervalle [t, t+dt[, se d´ecompose donc en :

dN(t) =Y(t)λ(t)dt+dM(t), (2.3)

o`u dM(t) correspond `a un bruit. La martingale M(t) = ^R

₀^t

dM(s) correspond `a un

bruit cumul´e.

L’intensit´eY(t)λ(t) du processusN(t) relativement `a l’histoireF

_t₋

correspond donc

`a :

Y(t)λ(t) = ^E(dN^(t)^|^F

^t⁻

⁾

dt ^. ^(2.4)

Le processusλ(t) est donc d´efini conditionnellement `a l’histoire, le conditionnement

´etant implicite dans la notation : λ(t) est en fait λ(t|F

_t₋

).

Dans l’expression (2.4) de l’intensit´e, l’intervalle de largeurdt est suppos´e

suffisam-ment court pour qu’un seul événesuffisam-ment au plus y survienne, et dN(t) est donc égal à 0

ou 1. L’intensit´e peut donc aussi s’´ecrire :

Y(t)λ(t) = ^P^{^dN^{(t) = 1}^|^F

^t⁻

^}

dt ^. ^(2.5)

Sous l’hypothèse d’une censure conditionnellement indépendante, c’est-à-dire siY(t)

etdN(t) sont ind´ependants conditionnellement au pass´e, alors si le processus complet

N

∗

(t) est d’intensit´eλ(t), le processus observable N(t) est d’intensit´eY(t)λ(t).

L’inférence statistique à partir de l’intensité des processus de comptage s’appuie sur

les propri´et´es des martingales.

Notons qu’en omettant le conditionnement par rapport au pass´e, on peut d´efinir le

mod`ele marginal :

Y(t)ρ(t) = ^E(dN^(t))

dt ^. ^(2.6)

On parlera alors de modèle sur le_«taux_»plutôt que sur l’intensité. Pour que la forme du

taux soit conservée en présence de censure, c’est-à-dire pour que Y(t)ρ(t) corresponde

au taux du processus observ´e lorsque le processus complet N

∗

(t) a un taux ρ(t), il

faut que Y(t) et dN(t) soient ind´ependants. C’est une hypoth`ese plus forte que dans

la modélisation de l’intensité où la censure peut dépendre du passé du processus. La

d´ecomposition (2.3) devient alors :

dN(t) =Y(t)ρ(t)dt+dr(t), (2.7)

etE(dr(t)) = 0.

Par ailleurs,^R

₀^t

dr(s) = N(t)−^R

₀^t

Y(s)ρ(s)dsn’est pas une martingale ce qui implique

une inférence différente. Les modèles marginaux seront brièvement abordés

conjointe-ment avec les modèles d’intensité canoniques pour lesquels le passé n’intervient pas dans

l’intensit´e.

2.1.2 Vraisemblance

On noteτ une durée de suivi maximale (e.g.τ =∞, ouτ = durée totale de l’étude).

On note C le d´elai de censure du processus (C ≤ τ), et Y(t) = I(t ≤ C) l’indicatrice

d’observation à l’instantt. La densité de probabilité associée au résultat :kévénements

surviennent aux dates t

₁

<· · ·< t

_k

est :

L=

k

Y

j=1

λ(t

j

) exp

−

Z

τ 0

Y(s)λ(s)ds

. (2.8)

Cette expression peut ˆetre obtenue comme un produit de contributions,

condition-nelles au pass´e, sur une partition de petits intervalles (Aalen et al., 2008, p210).

2.1. RAPPEL ET NOTATIONS SUR LES MOD`ELES D’INTENSIT´E 19

En considérant un ensemble de n processus individuels associés à n sujets, la

vrai-semblance est alors le produit de contributions individuelles de la forme (2.8).

Dans le cadre d’une modélisation où l’intensité λ(t) est exprimée en fonction de

paramètres à estimer, l’inférence sur ces paramètres à partir de la vraisemblance (2.8)

repose sur l’hypothèse d’une censure indépendante des événements conditionnellement

au passé. Dans le cas d’un modèle semi-paramétrique, une vraisemblance partielle peut

être utilisée dans le but de s’affranchir d’une spécification du risque de base, ainsi qu’on

le verra par la suite.

2.1.3 Mod`eles de r´egression

Notons x(t) un vecteur de covariables externes, ´eventuellement d´ependantes du

temps. On suppose souvent un effet multiplicatif des covariables sur l’intensit´e :

λ(t) =λ

0

(t)g(x(t),β),

o`uλ

0

(t) est l’intensit´e de base. Le plus souvent on utilise g(x(t),β) = exp{β

^t

x(t)}.

Dans un modèle d’intensité visant à estimer l’effet de covariables, la dépendance de

l’intensité par rapport au processus histoire doit être spécifiée. Selon l’échelle de temps

choisie, les modèles spécifiés généralisent l’un de deux modèles canoniques : les modèles

de Poisson et les mod`eles correspondant `a des processus de renouvellement.

Les modèles de Poisson supposent que l’intensité (2.5) ne dépend pas des événements

précédents mais seulement de t, et sont donc formulés en échelle de temps calendaire.

Les processus de renouvellement quant à eux supposent que l’intensité ne dépend

que du temps écoulé depuis le dernier événement, et sont donc formulés dans une échelle

de temps par intervalles :

λ(t) =h(t−T

N(t−)

). (2.9)

Les temps d’attente entre événements successifs sont alors indépendants et

identique-ment distribu´es, ce qui exclut l’inclusion de covariables d´ependantes du temps.

Dans le document Modèles multiplicatifs du risque pour des événements successifs en présence d’hétérogénéité (Page 41-45)

Télécharger maintenant "Modèles multiplicatifs..."

Outline

Documents relatifs