2.4 Modèles conjoints pour données longitudinales et temps d’événements 40
2.4.2 Modèles conjoints à classes latentes
Tout comme les modèles conjoints à effets aléatoires partagés, les modèles conjoints
à classes latentes permettent de modéliser simultanément un marqueur longitudinal
et un temps d’événement. La principale différence entre ces deux types de modèles
est la structure de lien entre le sous-modèle de survie et le sous-modèle longitudinal.
Dans le cas des modèles à effets aléatoires partagés, le lien entre les deux sous-modèles
est continu et se fait par les effets aléatoires. Ces modèles supposent que toute la
population est homogène et possède une évolution moyenne du marqueur longitudinal
considéré et les sujets présentent des déviations individuelles par rapport à cette
évolution moyenne. Cependant, l’hypothèse d’homogénéité peut paraître assez forte
notamment dans l’étude des maladies. Prenons le cas de la mucoviscidose qui est
une maladie complexe, avec plus de 2000 mutations qui ont des effets plus ou moins
graves chez les malades. La maladie se manifeste différemment d’un malade à l’autre,
même lorsqu’il s’agit de malades de la même fratrie. Il serait peu raisonnable de
supposer une évolution similaire de la maladie chez tous les malades. Dans ce cas, on
peut utiliser les modèles conjoints à classes latentes.
Les modèles conjoints à classes latentes sont plus récents et moins utilisés que les
modèles conjoints à effets aléatoires partagés [Lin et al. 2002; Proust-Lima et al.
2014]. Ils permettent de modéliser conjointement la survenue d’un événement et
l’évolution d’un marqueur longitudinal. Ces modèles supposent que la population
est hétérogène et peut être divisée en sous-groupes d’individus, homogènes
vis-à-vis du marqueur longitudinal et de l’événement considéré. Dans ces modèles la
corrélation entre le sous-modèle longitudinal et le sous-modèle de survie est capturée
par une structure latente discrète qui correspond à la variable aléatoire définissant
les sous-groupes d’individus ou classes latentes.
Spécification
Dans une population de N sujets (i= 1, . . . , N), notons Y le marqueur
longitudi-nal étudié avecY
i= (Y
i(t
i1), Y
i(t
i2), . . . , Y
i(t
ini)) le vecteur de taille n
id’observations
mesurées aux temps t
i1, . . . , t
inipour le sujet i. NotonsT
ile temps de survenue de
l’événement considéré, C
ivariable aléatoire de la censure à droite, δ
ila variable
indicatrice de l’événement. On définit le couple ( ˜T
i, δ
i) avec ˜T
i=min(T
i, C
i) etδ
i= 0
siT
i> C
ietδ
i= 1 sinon. On suppose que la population de N sujets est constituée
au total de G sous-populations homogènesg (g = 1, . . . , G) et on note c
ila variable
latente discrète qui vaut g si le sujeti appartient à la classe g.
Le modèle conjoint à classes latentes est constitué de trois sous modèles : un modèle
mixte qui décrit l’évolution du marqueur longitudinal, un modèle de survie le plus
souvent un modèle à risques proportionnels qui modélise le risque de survenue de
l’événement et un modèle logistique multinomial qui donne la probabilité
d’apparte-nance aux classes pour les sujets.
La probabilité pour le sujet i d’appartenir à la classe g est donnée par :
π
ig=P(c
i=g|X
0i) =
eτ0g+XT0iτ1g G X l=1e
τ0l+XT 0iτ1lCe modèle est rendu identifiable lorsqu’une classe est choisie comme classe de
référence, ici la classe G. On a alors τ
0G= 0 et τ
1G= 0. τ
0greprésente l’intercept
pour la classe g et τ
1gest le vecteur de paramètres associé au vecteur de covariables
X
0iet spécifiques à la classe g. La probabilité d’appartenir à la classe g par rapport
à la classe G qui est la classe de référence pour l’augmentation d’une unité de X
0iest donnée par exp(τ
1G).
La trajectoire du marqueur longitudinal pour le sujet idans la classe g est donnée
par :
Y
i(t
ij)|
ci=g=X
2i(t
ij)
Tβ+X
3i(t
ij)
Tδ
g+Z
i(t
ij)
Tb
ig+ǫ
i(t
ij)
où X
2i(t
ij)
Treprésente le vecteur de covariables associé au vecteur β d’effets fixes
commun à toutes les classes. X
3i(t
ij)
Treprésente le vecteur de covariables associé
au vecteur δ
gd’effets fixes spécifiques à chaque classe. Z
i(t
ij)
Test le vecteur de
covariables associé au vecteur b
ig=b
i|
ci=g∼N(µ
g, B) d’effets aléatoires spécifiques
à chaque classe. B est la matrice de variance-covariance des effets aléatoires qui
peut être spécifique à chaque classe (B = Bg) ou commune à toutes les classes.
ǫ
i= (ǫ
i(t
i1), ǫ
i(t
i2), ..., ǫ
i(t
ini))
T∼ N(0, σ
2I
ni) represente le vecteur des erreurs de
mesure pour le sujet i, oùσ
2I
niest une matrice diagonale de variance-covariance des
erreurs indépendantes. Selon la spécification du modèle, les erreurs peuvent également
2.4. Modèles conjoints pour données longitudinales et temps d’événements
être corrélées selon différentes structures de corrélation.
Le risque de survenue de l’événement pour le sujet i, dans la classeg est donné
par un modèle à risques proportionnels :
α
i(t|
ci=g) = α
0g(t;ζ
g)exp(X
4i(t)
Tλ
g+X
5i(t)
Tν)
où α
0greprésente la fonction de risque de base spécifique à la classe g et décrite
par le vecteur de paramètres ζ
g. Une distribution paramétrique peut être appliquée
sur la fonction de risque de base (Weibull, Gamma, spline. . . ). X
4i(t)
Treprésente
le vecteur de covariables associé au vecteur λ
gd’effets spécifiques à chaque classe.
X
5i(t)
Treprésente le vecteur de covariables associé au vecteur ν d’effets commun à
toutes les classes.
Les deux processus sont supposés indépendants conditionnellement à la classe
latente. Chaque classe est définie par un risque d’événement et une trajectoire
moyenne du marqueur longitudinal.
Estimation
Dans le cas des modèles conjoints à classes latentes, l’estimation des paramètres se
fait par la méthode du maximum de vraisemblance pour un nombre de classes Gfixé.
À partir de l’hypothèse d’indépendance entre les deux processus conditionnellement
aux classes latentes, la log-vraisemblance s’écrit :
L(θ
G) =
XN i=1log
G X g=1π
igf
Yi|ci(Y
i|c
i=g)α
i(T
i|c
i=g)
δiS
i(T
i|c
i=g)
où θ
Gest le vecteur de tous les paramètres du modèle conjoint. π
igest la
probabilité d’appartenir à la classe g pour le sujet i. f
Yi|ci(Y
i|c
i= g) est la
den-sité pour le marqueur longitudinal qui est distribuée selon une loi normale de
moyenneX
2iβ+X
3iδ
g+Z
iµ
get de matrice de variance-covariance Z
iBZ
Ti
+σ
2I
ni.
α
i(T
i|c
i=g)
δiS
i(T
i|c
i= g) représente la densité du temps d’événement pour données
censurées avec α
i(T
i|c
i= g) la fonction de risque instantané et S
i(T
i|c
i= g) la
fonction de survie.
Contrairement au modèle conjoint à effets aléatoires partagés, la log-vraisemblance
du modèle conjoint à classes latentes ne comporte pas d’intégrale et a donc une
expression analytique. Elle peut être maximisée par un algorithme itératif tel que
Marquardt et les variances des paramètres sont obtenues en inversant la matrice
Hessienne, tel que dans la fonction Jointlcmm du packagelcmm sous le logiciel R
qui permet d’estimer ces modèles [Proust-Lima et al. 2017].
La présence de maxima locaux est assez fréquente dans l’estimation des paramètres
du modèle conjoint à classes latentes. Il est recommandé d’estimer le modèle plusieurs
fois en partant de valeurs initiales différentes pour s’assurer de la convergence du
modèle vers le maximum global. Comme précisé précédemment, le modèle est estimé
pour un nombre de classes latentes fixé. Pour déterminer le nombre de classes latentes
optimal, on utilise entre autres le critère BIC (Bayesian Information Criterion). Dans
ce cas, on retiendra le modèle ayant le plus petit BIC.
Classification a posteriori
Il est possible à partir des modèles conjoints à classes latentes de calculer les
probabilités a posteriori d’appartenance aux classes pour les sujets. À partir de la
formule de Bayes, on a l’expression de la probabilité a posteriori d’appartenance à la
classe g pour le sujet i sachant les données longitudinales et le temps d’événement :
c
π
igY,T= P(c
i=g|Y
i|T
i, δ
i,θ
cG)
= π
cigf
Yi|ci(Y
i|c
i=g,θ
cG)α
i(T
i|c
i=g,θ
cG)
δiS
i(T
i|c
i=g,θ
cG)
G X l=1 cπ
ilf
Yi|ci(Y
i|c
i=l,θ
cG)α
i(T
i|c
i=l,θ
cG)
δiS
i(T
i|c
i=l,θ
cG)
Avec π
bigla probabilité d’appartenir à la classe g pour le sujet icalculée à partir
des valeurs estimées des paramètres θ
bG. Cette probabilité est utilisée pour évaluer la
qualité d’ajustement du modèle conjoint.
Le sujet est classé a posteriori dans la classe pour laquelle cette probabilité est la
plus grande.
Évaluation du modèle
L’évaluation du modèle conjoint à classes latentes en similaire à celle du modèle
conjoint à effets aléatoires partagés en ce qui concerne le sous-modèle de survie et
le sous-modèle longitudinal. Il est possible d’obtenir les prédictions marginales et
les prédictions conditionnelles aux effets aléatoires qui sont dans ce cas spécifiques
à la classe latente g. En plus, il est possible de moyenner les prédictions sur toutes
les classes latentes afin d’obtenir des prédictions individuelles par sujet. De même,
2.4. Modèles conjoints pour données longitudinales et temps d’événements
on peut obtenir des prédictions spécifiques aux classes en calculant la moyenne des
prédictions sur tous les sujets dans chaque classe latente [Proust-Lima et al. 2014].
Comme dans le cas des modèles conjoints à effets aléatoires, les résidus marginaux
et spécifiques aux sujets peuvent être obtenus. Dans les modèles conjoints à classes
latentes, il est important de bien déterminer le nombre de classes latentes. En plus
du critère BIC, la classificationa posteriori permet de guider ce choix en évaluation
la capacité discriminante du modèle. Une bonne classification correspond au cas où
chaque sujet a une probabilité élevée (proche de 1) d’appartenir à une classe et des
probabilités faibles (proches de 0) d’appartenir aux autres classes.
Dans le document
Prédiction du pronostic des patients atteints de muscoviscidose
(Page 57-61)