Modèles conjoints à classes latentes - Modèles conjoints pour données longitudinales et temps d

2.4 Modèles conjoints pour données longitudinales et temps d’événements 40

2.4.2 Modèles conjoints à classes latentes

Tout comme les modèles conjoints à eﬀets aléatoires partagés, les modèles conjoints

à classes latentes permettent de modéliser simultanément un marqueur longitudinal

et un temps d’événement. La principale diﬀérence entre ces deux types de modèles

est la structure de lien entre le sous-modèle de survie et le sous-modèle longitudinal.

Dans le cas des modèles à eﬀets aléatoires partagés, le lien entre les deux sous-modèles

est continu et se fait par les eﬀets aléatoires. Ces modèles supposent que toute la

population est homogène et possède une évolution moyenne du marqueur longitudinal

considéré et les sujets présentent des déviations individuelles par rapport à cette

évolution moyenne. Cependant, l’hypothèse d’homogénéité peut paraître assez forte

notamment dans l’étude des maladies. Prenons le cas de la mucoviscidose qui est

une maladie complexe, avec plus de 2000 mutations qui ont des eﬀets plus ou moins

graves chez les malades. La maladie se manifeste diﬀéremment d’un malade à l’autre,

même lorsqu’il s’agit de malades de la même fratrie. Il serait peu raisonnable de

supposer une évolution similaire de la maladie chez tous les malades. Dans ce cas, on

peut utiliser les modèles conjoints à classes latentes.

Les modèles conjoints à classes latentes sont plus récents et moins utilisés que les

modèles conjoints à eﬀets aléatoires partagés [Lin et al. 2002; Proust-Lima et al.

2014]. Ils permettent de modéliser conjointement la survenue d’un événement et

l’évolution d’un marqueur longitudinal. Ces modèles supposent que la population

est hétérogène et peut être divisée en sous-groupes d’individus, homogènes

vis-à-vis du marqueur longitudinal et de l’événement considéré. Dans ces modèles la

corrélation entre le sous-modèle longitudinal et le sous-modèle de survie est capturée

par une structure latente discrète qui correspond à la variable aléatoire déﬁnissant

les sous-groupes d’individus ou classes latentes.

Spécification

Dans une population de N sujets (i= 1, . . . , N), notons Y le marqueur

longitudi-nal étudié avecY

= (Y

(t

), Y

(t

), . . . , Y

(t

ini

)) le vecteur de taille n

d’observations

mesurées aux temps t

, . . . , t

ini

pour le sujet i. NotonsT

le temps de survenue de

l’événement considéré, C

variable aléatoire de la censure à droite, δ

la variable

indicatrice de l’événement. On déﬁnit le couple ( ˜T

, δ

) avec ˜T

=min(T

, C

) etδ

= 0

siT

> C

etδ

= 1 sinon. On suppose que la population de N sujets est constituée

au total de G sous-populations homogènesg (g = 1, . . . , G) et on note c

la variable

latente discrète qui vaut g si le sujeti appartient à la classe g.

Le modèle conjoint à classes latentes est constitué de trois sous modèles : un modèle

mixte qui décrit l’évolution du marqueur longitudinal, un modèle de survie le plus

souvent un modèle à risques proportionnels qui modélise le risque de survenue de

l’événement et un modèle logistique multinomial qui donne la probabilité

d’apparte-nance aux classes pour les sujets.

La probabilité pour le sujet i d’appartenir à la classe g est donnée par :

π

=P(c

=g|X

) =

e^τ0g+XT0i^τ1g G X l=1

e

^τ0l+XT 0iτ₁l

Ce modèle est rendu identiﬁable lorsqu’une classe est choisie comme classe de

référence, ici la classe G. On a alors τ

= 0 et τ

= 0. τ

représente l’intercept

pour la classe g et τ

est le vecteur de paramètres associé au vecteur de covariables

X

₀_i

et spéciﬁques à la classe g. La probabilité d’appartenir à la classe g par rapport

à la classe G qui est la classe de référence pour l’augmentation d’une unité de X

est donnée par exp(τ

).

La trajectoire du marqueur longitudinal pour le sujet idans la classe g est donnée

par :

Y

(t

_ij

)|

_c_i₌_g

=X

₂_i

(t

_ij

)

β+X

₃_i

(t

_ij

)

δ

+Z

(t

_ij

)

b

_ig

+ǫ

(t

_ij

)

où X

(t

)

représente le vecteur de covariables associé au vecteur β d’eﬀets ﬁxes

commun à toutes les classes. X

(t

)

représente le vecteur de covariables associé

au vecteur δ

d’effets fixes spécifiques à chaque classe. Z

(t

)

est le vecteur de

covariables associé au vecteur b

=b

|

ci=g

∼N(µ

, B) d’eﬀets aléatoires spéciﬁques

à chaque classe. B est la matrice de variance-covariance des eﬀets aléatoires qui

peut être spéciﬁque à chaque classe (B = Bg) ou commune à toutes les classes.

ǫ

= (ǫ

(t

), ǫ

(t

), ..., ǫ

(t

ini

))

∼ N(0, σ

I

) represente le vecteur des erreurs de

mesure pour le sujet i, oùσ

I

est une matrice diagonale de variance-covariance des

erreurs indépendantes. Selon la spéciﬁcation du modèle, les erreurs peuvent également

2.4. Modèles conjoints pour données longitudinales et temps d’événements

être corrélées selon diﬀérentes structures de corrélation.

Le risque de survenue de l’événement pour le sujet i, dans la classeg est donné

par un modèle à risques proportionnels :

α

(t|

ci=g

) = α

(t;ζ

)exp(X

(t)

λ

+X

(t)

ν)

où α

représente la fonction de risque de base spéciﬁque à la classe g et décrite

par le vecteur de paramètres ζ

. Une distribution paramétrique peut être appliquée

sur la fonction de risque de base (Weibull, Gamma, spline. . . ). X

(t)

représente

le vecteur de covariables associé au vecteur λ

d’eﬀets spéciﬁques à chaque classe.

X

(t)

représente le vecteur de covariables associé au vecteur ν d’eﬀets commun à

toutes les classes.

Les deux processus sont supposés indépendants conditionnellement à la classe

latente. Chaque classe est déﬁnie par un risque d’événement et une trajectoire

moyenne du marqueur longitudinal.

Estimation

Dans le cas des modèles conjoints à classes latentes, l’estimation des paramètres se

fait par la méthode du maximum de vraisemblance pour un nombre de classes Gﬁxé.

À partir de l’hypothèse d’indépendance entre les deux processus conditionnellement

aux classes latentes, la log-vraisemblance s’écrit :

L(θ

) =

^X^N i=1

log

  G X g=1

π

f

Yi|ci

(Y

|c

=g)α

(T

|c

=g)

δi

S

(T

|c

=g)

 

où θ

est le vecteur de tous les paramètres du modèle conjoint. π

est la

probabilité d’appartenir à la classe g pour le sujet i. f

_Y_i_|_c_i

(Y

|c

= g) est la

den-sité pour le marqueur longitudinal qui est distribuée selon une loi normale de

moyenneX

β+X

δ

+Z

µ

et de matrice de variance-covariance Z

BZ

+σ

I

.

α

(T

|c

=g)

δi

S

(T

|c

= g) représente la densité du temps d’événement pour données

censurées avec α

(T

|c

= g) la fonction de risque instantané et S

(T

|c

= g) la

fonction de survie.

Contrairement au modèle conjoint à eﬀets aléatoires partagés, la log-vraisemblance

du modèle conjoint à classes latentes ne comporte pas d’intégrale et a donc une

expression analytique. Elle peut être maximisée par un algorithme itératif tel que

Marquardt et les variances des paramètres sont obtenues en inversant la matrice

Hessienne, tel que dans la fonction Jointlcmm du packagelcmm sous le logiciel R

qui permet d’estimer ces modèles [Proust-Lima et al. 2017].

La présence de maxima locaux est assez fréquente dans l’estimation des paramètres

du modèle conjoint à classes latentes. Il est recommandé d’estimer le modèle plusieurs

fois en partant de valeurs initiales diﬀérentes pour s’assurer de la convergence du

modèle vers le maximum global. Comme précisé précédemment, le modèle est estimé

pour un nombre de classes latentes ﬁxé. Pour déterminer le nombre de classes latentes

optimal, on utilise entre autres le critère BIC (Bayesian Information Criterion). Dans

ce cas, on retiendra le modèle ayant le plus petit BIC.

Classification a posteriori

Il est possible à partir des modèles conjoints à classes latentes de calculer les

probabilités a posteriori d’appartenance aux classes pour les sujets. À partir de la

formule de Bayes, on a l’expression de la probabilité a posteriori d’appartenance à la

classe g pour le sujet i sachant les données longitudinales et le temps d’événement :

π

ig^Y,T

= P(c

=g|Y

|T

, δ

,θ

^cG

)

= ^π

^cig

f

Yi|ci

(Y

|c

=g,θ

^cG

)α

(T

|c

=g,θ

^cG

)

δi

S

(T

|c

=g,θ

^cG

)

G X l=1 c

π

f

Yi|ci

(Y

|c

=l,θ

^cG

)α

(T

|c

=l,θ

^cG

)

δi

S

(T

|c

=l,θ

^cG

)

Avec π

big

la probabilité d’appartenir à la classe g pour le sujet icalculée à partir

des valeurs estimées des paramètres _θ

b_G

. Cette probabilité est utilisée pour évaluer la

qualité d’ajustement du modèle conjoint.

Le sujet est classé a posteriori dans la classe pour laquelle cette probabilité est la

plus grande.

Évaluation du modèle

L’évaluation du modèle conjoint à classes latentes en similaire à celle du modèle

conjoint à eﬀets aléatoires partagés en ce qui concerne le sous-modèle de survie et

le sous-modèle longitudinal. Il est possible d’obtenir les prédictions marginales et

les prédictions conditionnelles aux eﬀets aléatoires qui sont dans ce cas spéciﬁques

à la classe latente g. En plus, il est possible de moyenner les prédictions sur toutes

les classes latentes aﬁn d’obtenir des prédictions individuelles par sujet. De même,

2.4. Modèles conjoints pour données longitudinales et temps d’événements

on peut obtenir des prédictions spéciﬁques aux classes en calculant la moyenne des

prédictions sur tous les sujets dans chaque classe latente [Proust-Lima et al. 2014].

Comme dans le cas des modèles conjoints à eﬀets aléatoires, les résidus marginaux

et spéciﬁques aux sujets peuvent être obtenus. Dans les modèles conjoints à classes

latentes, il est important de bien déterminer le nombre de classes latentes. En plus

du critère BIC, la classiﬁcationa posteriori permet de guider ce choix en évaluation

la capacité discriminante du modèle. Une bonne classiﬁcation correspond au cas où

chaque sujet a une probabilité élevée (proche de 1) d’appartenir à une classe et des

probabilités faibles (proches de 0) d’appartenir aux autres classes.

Dans le document Prédiction du pronostic des patients atteints de muscoviscidose (Page 57-61)