• Aucun résultat trouvé

Modèles de mélange pour données récurrentes : application aux récidives des cancer

N/A
N/A
Protected

Academic year: 2021

Partager "Modèles de mélange pour données récurrentes : application aux récidives des cancer"

Copied!
4
0
0

Texte intégral

(1)

HAL Id: inria-00386615

https://hal.inria.fr/inria-00386615

Submitted on 22 May 2009

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Modèles de mélange pour données récurrentes : application aux récidives des cancer

Virginie Rondeau, Emmanuel Schaffner, Fabien Corbière, Simone Mathoulin-Pélissier

To cite this version:

Virginie Rondeau, Emmanuel Schaffner, Fabien Corbière, Simone Mathoulin-Pélissier. Modèles de

mélange pour données récurrentes : application aux récidives des cancer. 41èmes Journées de Statis-

tique, SFdS, Bordeaux, 2009, Bordeaux, France, France. �inria-00386615�

(2)

Mod` eles de m´ elange pour donn´ ees r´ ecurrentes : application aux r´ ecidives des cancer

Virginie Rondeau

1,2

, Emmanuel Schaffner

1

, Fabien Corbi` ere

1,3

, and Simone Mathoulin-P´ elissier

4

1

INSERM, U897 (Biostatistic), Bordeaux, F-33076, FRANCE ;

2

Universit´ e Victor Segalen Bordeaux 2, Bordeaux, F-33076, FRANCE ;

3

INRA-UMR 1225, Toulouse, F-31076, FRANCE ;

4

Institut Bergoni´ e - Centre R´ egional de Lutte Contre le Cancer du Sud-Ouest (Clinical Research Unit), Bordeaux, F-33076, FRANCE.

RESUME

Dans les analyses de survie traditionnelles, en ayant un suivi suffisamment long on suppose que chaque individu est ` a risque de d´ evelopper un ´ ev´ enement. Cependant, si l’´ ev´ enement consid´ er´ e est par exemple une r´ ecidive de cancer, une fraction de la popu- lation dite ” gu´ erie ”, ne va jamais rencontrer cet ´ ev´ enement mˆ eme apr` es un tr` es long suivi. Les mod` eles de m´ elange pourront d’une part permettre d’estimer cette fraction mais aussi la fonction de survie pour les patients susceptibles de d´ evelopper une r´ ecidive.

Ces mod` eles de m´ elange avec taux de gu´ erison g´ en´ eralisent le mod` ele ` a risques propor- tionnels de Cox en tenant compte de l’existence d’une sous population qui n’est pas ` a risque de d´ evelopper l’´ ev´ enement d’int´ erˆ et. Nous avons propos´ e des mod` eles de m´ elange

`

a effets al´ eatoires. Les estimations ont ´ et´ e obtenues par la proc´ edure NLMIXED du lo- giciel SAS pour des mod` eles de survie avec fonctions de risque constantes par morceaux.

Contrairement au simple mod` ele ` a fragilit´ e, les m´ ethodes propos´ ees semblent prometteuses pour mod´ eliser des donn´ ees de survie mutlivari´ ees avec des survivants ` a long-termes. Les donn´ ees de r´ ecidives de cancer du sein ont ´ et´ e utilis´ ees.

ABSTRACT

Owing to the natural evolution of a disease, several events often arise after a first treatment for the same subject. For example, patients with a primary invasive breast cancer and treated with breast conserving surgery may experience breast cancer recur- rences, metastases or death. A certain proportion of subjects in the population who are not expected to experience the events of interest are considered to be ”cured” or non- susceptible. To model correlated failure time data incorporating a surviving fraction, we compare two forms of cure rate frailty models. We illustrate the cure frailty models with the analysis of prognostic factors associated with breast cancer recurrences, metastases, new primary malignancy and death. Estimates were obtained by maximization of likeli- hood using SAS proc NLMIXED for a piecewise constant hazards model. As opposed to the simple frailty model, the proposed methods demonstrate great potential in modelling multivariate survival data with long-term survivors (”cured” individuals).

1

(3)

Dans les analyses de survie traditionnelles, en ayant un suivi suffisamment long, on suppose que chaque individu est ` a risque de d´ evelopper un ´ ev´ enement. Cependant, une fraction de la population, dite ”gu´ erie”, ne va jamais rencontrer cet ´ ev´ enement mˆ eme apr` es un tr` es long suivi. Ainsi la fonction de survie reste ` a un niveau non nul apr` es un certain temps. Cette probl´ ematique aborde la notion de mod` eles de m´ elange en analyse de survie pour fraction non ` a risque, une th´ ematique sur laquelle j’ai r´ ecemment travaill´ e avec Pierre Joly et Fabien Corbi` ere (son pr´ ec´ edent ´ etudiant en th` ese) dans l’´ equipe de Biostatistique. La motivation initiale ´ etait de travailler sur des mod` eles de m´ elange pour donn´ ees group´ ees (”Cure frailty models”) en s’appuyant sur l’´ etude de la tremblante du mouton pour des donn´ ees regroup´ ees en ´ elevages. Ces mod` eles ont ´ et´ e essentiellement propos´ es pour analyser des donn´ ees de survie group´ ees (Yin, 2005) en introduisant des effets al´ eatoires pour tenir compte de la corr´ elation intra-groupe.

Nous avons r´ ecemment travaill´ e sur ces mod` eles de m´ elange pour analyser les donn´ ees r´ ecurrentes de r´ ecidives de cancer du sein. Dans l’analyse de donn´ ees de cancer du sein, cette approche par mod` eles de gu´ erison (ou mod` eles de m´ elange) est tout ` a fait r´ ealiste, puisqu’il a ´ et´ e montr´ e par exemple que certaines r´ ecidives loco-r´ egionales ´ etaient poten- tiellement curables, n’´ etant pas suivies d’une ´ etendue ` a distance de la maladie. A nouveau, dans cette analyse d’´ ev´ enements de survie r´ ep´ et´ es dans le temps, la population d’´ etude est un m´ elange de deux sous-populations : une fraction non ` a risque de r´ ecidives (ou ”gu´ erie”), et une fraction ` a risque de r´ ecidives. Nous avons propos´ e deux formes de mod` eles ` a fragi- lit´ es avec fraction non ` a risque. Dans le premier mod` ele, les patientes non-susceptibles sont celles qui ne connaˆıtront jamais de r´ ecidives. La probabilit´ e d’ˆ etre ”gu´ erie” est donc fixe pour chaque sujet. Le deuxi` eme mod` ele tient compte de la possibilit´ e de gu´ erison apr` es chaque nouvel ´ ev´ enement. Ainsi, apr` es chaque nouvel ´ ev´ enement, une patiente a une nou- velle probabilit´ e de ”gu´ erison”. On notera U , indiquant si un individu d´ eveloppera (U=1) ou ne d´ eveloppera pas une r´ ecidive. Pour des ´ ev´ enements observ´ es, nous savons que U = 1, et que la patiente est non gu´ erie. Lorsqu’une patiente est censur´ ee, alors nous pouvons avoir U = 1 ou U = 0. On introduit π(X

) = P (U = 1 | X

) la probabilit´ e d’ˆ etre non gu´ erie qui d´ epend d’un vecteur de variables explicatives X

= (X

1

, . . . , X

q

)

0

. Ce mod` ele de m´ elange ` a fragilit´ es s’´ ecrit :

 

 

S(t

ij

| X

ij

, X

ij

, ω

i

) = 1 − π

ij

(X

ij

| ω

i

) + π

ij

(X

ij

| ω

i

) exp(−Λ

0

(t

ij

| U = 1) exp(β

0

X

ij

+ ω

i

)) π

ij

(X

ij

| ω

i

) = P (U = 1 | X

ij

) =

exp(b

0Xij+αωi) (1+exp(b0Xij+αωi))

ω

i

∼ N (0; θ

2

), ω

i

⊥ ω

i0

(1)

Les effets al´ eatoires ω

i

vont tenir compte de la corr´ elation intra-sujets des donn´ ees, et le param` etre α permettra de d´ ecrire l’association entre la probabilit´ e d’ˆ etre ` a risque et l’intensit´ e du risque de r´ ecidives de cancer li´ ee ` a la variable de fragilit´ e. Pour une valeur positive de α, une fragilit´ e ´ elev´ ee r´ esultera en une probabilit´ e plus ´ elev´ ee d’appartenir ` a la fraction ` a risque et en une survie r´ eduite chez les sujets ` a risque. On s’interesse ` a l’effet de facteurs sur le fait d’appartenir ou non ` a la fraction ` a risque, g´ en´ eralement par un

2

(4)

mod` ele logistique, mais aussi ` a l’effet de facteurs (pouvant ˆ etre diff´ erents) sur la dur´ ee de survie des sujets ` a risques par un mod` ele ` a risques proportionnels.

Les estimations ont ´ et´ e obtenues par la proc´ edure NLMIXED du logiciel SAS pour des mod` eles de survie avec fonctions de risque constantes par morceaux et des m´ ethodes d’int´ egrations num´ eriques par quadrature gaussiennes adaptatives. Contrairement au simple mod` ele ` a fragilit´ es, les mod` eles de m´ elange ` a fragilit´ es propos´ es semblent prometteurs pour mod´ eliser des donn´ ees de survie multivari´ ees avec des patients gu´ eris ` a long-terme.

Bibliographie

[1] Sy, JP., Taylor, JM. (2000) Estimation in a Cox proportional hazards cure model.

Biometrics, 56, 227–236.

[2] Peng, Y., Dear, KB. (2000) A nonparametric mixture model for cure rate estimation.

Biometrics, 56, 237–43.

[3] Yu, B., Tiwari, RC., Cronin, KA., Feuer, EJ. (2004) Cure fraction estimation from the mixture cure models for grouped survival data. Statistics in Medicine, 23, 1733–1747.

[4] Yin, G. (2005) Bayesian cure rate frailty models with application to a root canal therapy study. Biometrics, 61, 552–8.

[5] Yu, B. (2008) A frailty mixture cure model with application to hospital readmission data. Biometrical Journal, 50, 386–394.

3

Références

Documents relatifs

En r ´ealit ´e le m ´ecanisme est plus complexe, c’est une r ´eaction d’autocatalyse dans laquelle interviennent plusieurs r ´eactions avec des vitesses de diff ´erents ordres

Le syst` eme informatique d’une biblioth` eque enregistre le num´ ero national, le nom, le pr´ enom et l’adresse (rue, num´ ero, code postal, ville) de chacun de ses clients.. Le

Estimation des param` etres et de l’´ etat cach´ e des mod` eles d’espace d’´ etats: application au mod`

En occultant ensuite cette information, ajuster un ou plusieurs mod` eles (soit de type AR/MA/ARMA/ARIMA/SARIMA, soit de type r´ egression avec tendance et/ou saisonnalit´ e

Quelles sont les caract´eristiques observ´ees sur le march´e pour les produits spot et forward que le mod`ele 2 facteurs permet de reproduire?. Quels effets ne permet-il pas

On suppose que l’on observe seulement le nombre de particules dans le r´ecipient A au cours du temps, et que l’on d´esire estimer le nombre total de particules. Et construire

(2003) apply the same model to unemployment rate estimation for the Canadian Labour Force Survey using shorter time series data and do not consider seasonal adjustments.. In this

hi´ erarchique R´ eponse Normale Introduit les Mod` eles de Markov Latents en SAE Enquˆ ete LFS: donn´ ees trimestrielles 2004-2014.. Meilleure Pr´ ediction Empirique SAE avec donn´