HAL Id: inria-00386615
https://hal.inria.fr/inria-00386615
Submitted on 22 May 2009
HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
Modèles de mélange pour données récurrentes : application aux récidives des cancer
Virginie Rondeau, Emmanuel Schaffner, Fabien Corbière, Simone Mathoulin-Pélissier
To cite this version:
Virginie Rondeau, Emmanuel Schaffner, Fabien Corbière, Simone Mathoulin-Pélissier. Modèles de
mélange pour données récurrentes : application aux récidives des cancer. 41èmes Journées de Statis-
tique, SFdS, Bordeaux, 2009, Bordeaux, France, France. �inria-00386615�
Mod` eles de m´ elange pour donn´ ees r´ ecurrentes : application aux r´ ecidives des cancer
Virginie Rondeau
1,2, Emmanuel Schaffner
1, Fabien Corbi` ere
1,3, and Simone Mathoulin-P´ elissier
41
INSERM, U897 (Biostatistic), Bordeaux, F-33076, FRANCE ;
2
Universit´ e Victor Segalen Bordeaux 2, Bordeaux, F-33076, FRANCE ;
3
INRA-UMR 1225, Toulouse, F-31076, FRANCE ;
4
Institut Bergoni´ e - Centre R´ egional de Lutte Contre le Cancer du Sud-Ouest (Clinical Research Unit), Bordeaux, F-33076, FRANCE.
RESUME
Dans les analyses de survie traditionnelles, en ayant un suivi suffisamment long on suppose que chaque individu est ` a risque de d´ evelopper un ´ ev´ enement. Cependant, si l’´ ev´ enement consid´ er´ e est par exemple une r´ ecidive de cancer, une fraction de la popu- lation dite ” gu´ erie ”, ne va jamais rencontrer cet ´ ev´ enement mˆ eme apr` es un tr` es long suivi. Les mod` eles de m´ elange pourront d’une part permettre d’estimer cette fraction mais aussi la fonction de survie pour les patients susceptibles de d´ evelopper une r´ ecidive.
Ces mod` eles de m´ elange avec taux de gu´ erison g´ en´ eralisent le mod` ele ` a risques propor- tionnels de Cox en tenant compte de l’existence d’une sous population qui n’est pas ` a risque de d´ evelopper l’´ ev´ enement d’int´ erˆ et. Nous avons propos´ e des mod` eles de m´ elange
`
a effets al´ eatoires. Les estimations ont ´ et´ e obtenues par la proc´ edure NLMIXED du lo- giciel SAS pour des mod` eles de survie avec fonctions de risque constantes par morceaux.
Contrairement au simple mod` ele ` a fragilit´ e, les m´ ethodes propos´ ees semblent prometteuses pour mod´ eliser des donn´ ees de survie mutlivari´ ees avec des survivants ` a long-termes. Les donn´ ees de r´ ecidives de cancer du sein ont ´ et´ e utilis´ ees.
ABSTRACT
Owing to the natural evolution of a disease, several events often arise after a first treatment for the same subject. For example, patients with a primary invasive breast cancer and treated with breast conserving surgery may experience breast cancer recur- rences, metastases or death. A certain proportion of subjects in the population who are not expected to experience the events of interest are considered to be ”cured” or non- susceptible. To model correlated failure time data incorporating a surviving fraction, we compare two forms of cure rate frailty models. We illustrate the cure frailty models with the analysis of prognostic factors associated with breast cancer recurrences, metastases, new primary malignancy and death. Estimates were obtained by maximization of likeli- hood using SAS proc NLMIXED for a piecewise constant hazards model. As opposed to the simple frailty model, the proposed methods demonstrate great potential in modelling multivariate survival data with long-term survivors (”cured” individuals).
1
Dans les analyses de survie traditionnelles, en ayant un suivi suffisamment long, on suppose que chaque individu est ` a risque de d´ evelopper un ´ ev´ enement. Cependant, une fraction de la population, dite ”gu´ erie”, ne va jamais rencontrer cet ´ ev´ enement mˆ eme apr` es un tr` es long suivi. Ainsi la fonction de survie reste ` a un niveau non nul apr` es un certain temps. Cette probl´ ematique aborde la notion de mod` eles de m´ elange en analyse de survie pour fraction non ` a risque, une th´ ematique sur laquelle j’ai r´ ecemment travaill´ e avec Pierre Joly et Fabien Corbi` ere (son pr´ ec´ edent ´ etudiant en th` ese) dans l’´ equipe de Biostatistique. La motivation initiale ´ etait de travailler sur des mod` eles de m´ elange pour donn´ ees group´ ees (”Cure frailty models”) en s’appuyant sur l’´ etude de la tremblante du mouton pour des donn´ ees regroup´ ees en ´ elevages. Ces mod` eles ont ´ et´ e essentiellement propos´ es pour analyser des donn´ ees de survie group´ ees (Yin, 2005) en introduisant des effets al´ eatoires pour tenir compte de la corr´ elation intra-groupe.
Nous avons r´ ecemment travaill´ e sur ces mod` eles de m´ elange pour analyser les donn´ ees r´ ecurrentes de r´ ecidives de cancer du sein. Dans l’analyse de donn´ ees de cancer du sein, cette approche par mod` eles de gu´ erison (ou mod` eles de m´ elange) est tout ` a fait r´ ealiste, puisqu’il a ´ et´ e montr´ e par exemple que certaines r´ ecidives loco-r´ egionales ´ etaient poten- tiellement curables, n’´ etant pas suivies d’une ´ etendue ` a distance de la maladie. A nouveau, dans cette analyse d’´ ev´ enements de survie r´ ep´ et´ es dans le temps, la population d’´ etude est un m´ elange de deux sous-populations : une fraction non ` a risque de r´ ecidives (ou ”gu´ erie”), et une fraction ` a risque de r´ ecidives. Nous avons propos´ e deux formes de mod` eles ` a fragi- lit´ es avec fraction non ` a risque. Dans le premier mod` ele, les patientes non-susceptibles sont celles qui ne connaˆıtront jamais de r´ ecidives. La probabilit´ e d’ˆ etre ”gu´ erie” est donc fixe pour chaque sujet. Le deuxi` eme mod` ele tient compte de la possibilit´ e de gu´ erison apr` es chaque nouvel ´ ev´ enement. Ainsi, apr` es chaque nouvel ´ ev´ enement, une patiente a une nou- velle probabilit´ e de ”gu´ erison”. On notera U , indiquant si un individu d´ eveloppera (U=1) ou ne d´ eveloppera pas une r´ ecidive. Pour des ´ ev´ enements observ´ es, nous savons que U = 1, et que la patiente est non gu´ erie. Lorsqu’une patiente est censur´ ee, alors nous pouvons avoir U = 1 ou U = 0. On introduit π(X
∗) = P (U = 1 | X
∗) la probabilit´ e d’ˆ etre non gu´ erie qui d´ epend d’un vecteur de variables explicatives X
∗= (X
1∗, . . . , X
q∗)
0. Ce mod` ele de m´ elange ` a fragilit´ es s’´ ecrit :
S(t
ij| X
ij, X
ij∗, ω
i) = 1 − π
ij(X
ij∗| ω
i) + π
ij(X
ij∗| ω
i) exp(−Λ
0(t
ij| U = 1) exp(β
0X
ij+ ω
i)) π
ij(X
ij∗| ω
i) = P (U = 1 | X
ij∗) =
exp(b0Xij∗+αωi) (1+exp(b0Xij∗+αωi))