dépendant du temps, les strates dépendant du temps, les évènements multiples par observation et d’autres extensions sont possibles avec cette fonction

Usage: coxph(formula, data=parent.frame(), weights, subset,

na.action, init, control, method=c("efron","breslow","exact"),

singular.ok=TRUE, robust=FALSE, model=FALSE, x=FALSE, y=TRUE,... )

II-2 Fonction coxph()

Arguments:

formula: un objet de type formule, dont la réponse (variable à expliquer) est mise à gauche de l’opérateur '~‘ , et les variables explicatives à droite. La réponse doit être un objet de type Surv (comme ceux retournés par Surv()).

data: un data.frame dans lequel se trouvent les variables données dans 'formula', ou dans les arguments 'subset' et 'weights'.

arguments 'subset' et 'weights'.

subset: expression indiquant que seules les lignes de « subset » doivent être utilisées pour l’ajustement.

na.action: une fonction de filtre pour les valeurs manquantes. Default is 'options()$na.action'.

weights: poids éventuels.

init: vecteur de valeurs initiales pour l’itération dans le calcul des estimations du maximum de la vraisemblance partielle. Par défaut, ces valeurs sont nulles pour toutes les variables.

II-2 Fonction coxph()

control:Objets de classe 'coxph.control' spécifiant le nombre max d’itérations et d’autres options de contrôle. Default is 'coxph.control(...)'.

method: chaîne de caractères spécifiant la méthode utilisée pour le calcul de la vraisemblance en cas d’ex-aequos (s’il n’y a pas d’ex-aequos toutes les méthodes sont équivalentes). Par défaut, méthode de « Efron ». La méthode « Exact » calcule la vraisemblance partielle exacte, mais très gourmande en temps.

exacte, mais très gourmande en temps.

singular.ok: valeur logique indiquant gérer la collinéarité. Si 'TRUE', le programme va automatiquement enlever les covariables qui sont combinaison linéaires des covariables précédentes (dans la matrice des covariables). Dans ce cas, les coefficients pour ces covariables sont NA, et la matrice de var-cov des coefficients contient des zeros.

robust: Si TRUE un estimateur robuste de la matrice de var-cov des coefficients est donné.

Default is 'FALSE‘.

Details: Le modèle de HP est généralement exprimé en terme d’un unique temps de survie par personne (ou système), éventuellement censuré. Andersen and Gill on reformulé le

problème en terme de processus de comptage: en fonction du temps, on enregistre le nombre d’évènements par personne. Les données par personne sont présentées sur plusieurs lignes, chacune étant relative à un intervalle (start, stop].

Value: Un objet de classe '"coxph"'. See 'coxph.object' for details.

II-2 Fonction coxph()

SPECIAL TERMS: Il y a deux termes spéciaux pouvant être utilisés dans la formule. Le terme 'strata' identifie un modèle de Cox stratifié: des baselines distinctes sont ajustées à chaque strate. Le terme 'cluster' est utilisé pour calculer une variance robuste pour le modèle. Le terme '+ cluster(id)', où 'id == unique(id)', revient à spécifier l’argument 'robust=T' et produit un estimateur approché par Jacknife de la variance.Si la variable 'id' n’est pas unique mais identifie des classes d’observations corrélées, alors l’estimateur de la variance est basé sur un Jacknife groupé.

est basé sur un Jacknife groupé.

CONVERGENCE: Dans certains cas, le MLE d’un coefficent est infini, par exemple, dans le cas d’une covariable dichotomique dont l’un des groupes n’a pas d’événement. Dans ce cas, l’algorithme de recherche du MLE diverge. Ce programme permet de détecter lorsque cela arrive.

PENALISED REGRESSION: 'coxph' peut maximiser une vraisemblance partielle pénalisée avec une fonction de pénalisation définie par l’utilisateurcan now maximise a penalised partial likelihood with arbitrary user-defined penalty. Parmi les fonctions de pénalisation pré-définies dans R, on trouve la ridge regression (ridge), les smoothing splines (pspline), and les frailty models (frailty).

II-2 Fonction coxph()

>cox$coef : donne le vecteur des coefficients

>cox$score: donne la valeur de la statistique du test des scores

>cox$wald.test: donne la valeur de la statistique du test des scores

>cox$loglik:donne deux valeurs : la valeur de la log-vraisemblance avec les coefficients initiaux (mis à 0 sauf si ils sont donnés dans init) et celle avec les coefficients finaux (estimés)

>cox$var : matrice de var-cov des coefficients (sigma)

>cox$iter : nombre d’itérations utilisées pour calculer les coefficients (optimisation de la log-vraisemblance partielle)

>cox$linear.predictors: valeurs beta’z pour chaque individu

>cox$residuals: résidus de martingales

ˆj

II-2 Fonction coxph()

>cox$method: méthode de calcul de la log-vraisemblance en cas d’ex-aequo (Efron par défaut)

>cox$residuals: résidus de martingales

>cox$y : vecteur des observations (+ indique qu’il s’agit d’une censure)

II-2 fonctions annexes: residuals.coxph

Description : Calcule les résidus de martingale, de la deviance, du score et les résidus de Schoenfeld pour un modèle de Cox.

Usage: residuals(object, type=c("martingale", "deviance", "score", "schoenfeld", "dfbeta",

"dfbetas", "scaledsch","partial"), collapse=FALSE, weighted=FALSE, ...) Arguments

Object : Typiquement, la sortie de coxph()

Type: chaine de caractère indiquant le type de résidu désiré. Les valeurs possibles sont

"martingale", "deviance", "score", "schoenfeld", "dfbeta"', "dfbetas", and "scaledsch".

Collapse : vecteur indiquant quelles sont les lignes que l’on doit sommer : dans les modèles de HP dépendants du temps, on peut avoir plusieurs lignes par individu.

Weighted : Si TRUE et que le modèle a été ajusté en tenant compte de poids, les résidus pondérés sont retounés.

Value : Pour les résidus de déviance et de martingales, l’objet retourné est un vecteur avec une composante par individu. Pour le résidu des scores, c’est une matrice avec une ligne par sujet et une colonne par covariable. Pour les résidus de Schoenfeld, c’est une matrice avec une ligne par événement et une colonne par covariable. Les lignes sont rangées par instants d’occurrence croissants à l’intérieur d’une même strate. Pour les résidus de Schoenfeld normalisés, on utilie cox.zph. Les résidus de scores représentent chaque contribution

individuelle au vecteur de score. Deux transformations sont souvent utilisées : dfbeta est le changement approximatif dans le vecteur de coefficients lorsque une observation est enlevée et dfbetas est le changement approximatif dans les coefficients, renormalisé par l’écart-type des coefficients.

II-2 fonctions annexes: coxph.zph

Description : Teste l’hypothèse de HP pour un modèle de cox (coxph).

Usage : cox.zph(fit, transform="km", global=TRUE) Arguments

Fit : le résultat de coxph().

Transform : une chaine de caractère spécifiant comment les temps de survie doivent être transformés avant de faire le test : les valeur possibles sont "km", "rank", "identity" .Le défaut est "km" pour des données censurées à droite, "identity" pour des données de processus de comptage.

processus de comptage.

Global: permet de calculer un test du chi2 global en plus des tests pour chaque covariable.

Value : un objet de classe "cox.zph", avec les composants:

Table: matrice avec une ligne par covariable et de facon optionnelle une dernière ligne pour le test global. Les colonnes de la matrice contiennet les coefficients de corrélationentre les temps de survie transformés et les résidus de Schoenfeld renormalisés, une p-value pour le test du chi2 et pour le test bilateral.

x: l’axe de temps transformé.

y : la matrice des scaled Schoenfeld residuals. Une colonne par covariable et une ligne par événement.

III- Fonction survfit()

Description : Calcule un estimateur de la fonction de survie pour des données censurées en utilisant les méthode de Kaplan-Meier ou de Fleming-Harrington ou bien calcule la fonction de survie prédite par le modèle de Cox .

Usage: survfit(formula, data, weights, subset, na.action, newdata, individual=F, conf.int=.95, se.fit=T, type=c("kaplan-meier","fleming-harrington", "fh2"),

error=c("greenwood","tsiatis"), conf.type=c("log","log-log","plain","none"), conf.lower=c("usual", "peto", "modified")) , basehaz(fit,centered=TRUE) conf.lower=c("usual", "peto", "modified")) , basehaz(fit,centered=TRUE) Arguments

Formula: Un objet de type formula ou coxph. Si un objet de type formule est donné, il doit avoir un objet de type Surv en réponse et éventuellement des termes séparés par l’opérateur + à droite de ~ . Un de ces termes peut être un objet « strata ». Pour une seule courbe de survie

"~ 1" peut être omis.

Data: un data frame dans lequel figurent les données Weights: des poids éventuels

Subset : sous ensemble de lignes utilisées pour l’ajustement

na.action : fonction de filtre pour les valeurs manquantes. Default is options()$na.action.

III- Fonction survfit()

Newdata: utilisé avec une formule de classe coxph. Nouveau data frame ayant les mêmes noms de variables que les covariables utilisées dans la formule de coxph. Les fonctions de survie produites seront celles d’une cohorte dont les covariables correspondent aux valeurs de ce nouveau tableau. Par défaut, survfit() trace la fonction de survie en utilisant les valeurs moyennes des covariables.

Individual: une valeur logique indiquant si les données représentent différentes époques d’un mêmle individu (T) ou si au contraire les différentes lignes du tableu représentent des individus différents (F, le défaut). Dans le premier cas, une seule courbe sera^produite.

individus différents (F, le défaut). Dans le premier cas, une seule courbe sera^produite.

Dans le second cas, il y aura une courbe par ligne de newdata.

conf.int : le niveau de confiance pour l’intervalle de confiance bilatéral autour de la courbe de survie. Le défaut est 95%.

Type : une chaîne de caractère indiquant le type d’estimation utilisée pour la fonction de survie.

Les valeurs possibles sont "kaplan-meier", "fleming-harrington" ou "fh2" si une formule est donnée et "aalen" ou "kaplan-meier" si le premier argument est de type coxph. Le défaut est

"aalen" dans le dernier cas et "kaplan-meier" dans le premier cas.

Error : chaine de caractère dont les valeurs possible sont "greenwood" pour la formule de

Greenwood ou "tsiatis" pour la formule de Tsiatis (estimateurs de la matrice de var-cov des coefficients). Le défaut est "tsiatis" lorsqu’un objet de type coxph est donné et

"greenwood" sinon.

III- Fonction survfit()

Details: Les estimateurs utilisés sont ceux de Kalbfleisch-Prentice et

Tsiatis/Link/Breslow, qui se réduisent aux estimateurs de Kaplan-Meier and

Dans le document I- Exemple d’ajustement d’un modèle de Cox II- Programmation sous R (Page 52-62)