• Aucun résultat trouvé

Cours 5- Hétérogénéité

N/A
N/A
Protected

Academic year: 2022

Partager "Cours 5- Hétérogénéité"

Copied!
63
0
0

Texte intégral

(1)

Cours 5- Hétérogénéité

A- Généralités

B- Modèles avec covariables

C- Modèles de fragilité

(2)

A- Généralités

ü  Tous les individus ne sont pas identiques : hétérogénéité

ü  Cette hétérogénéité, si elle n’est pas prise en compte induit des biais dans la modélisation.

ü  Deux types d’hétérogénéités :

§  Observée : modèles à covariables - permettent de prendre en compte ou d’expliquer les différences de survie d’une population par des différences de valeurs prises sur des facteurs explicatifs z (covariables) observables, généralement exogènes (environnement, facteurs culturels, etc….).

§  Non observée (cachée) : modèles de fragilité ou à hétérogénéité cachée – L’hétérogénéité ne peut pas être expliquée en entier par les facteurs explicatifs dont on dispose.

(3)

B- Modèles avec covariables

I- Définition et contexte d’utilisation II- Modèles célèbres

III- Estimation paramétrique

IV- Estimation semi-paramétrique dans les modèles de HP

V- Autres modèles

(4)

I- Définition et contexte d’utilisation

ü  Modèle avec covariable= modèle tel que la loi de la durée de vie est fonction des valeurs prises par des variables explicatives

(covariables) Z

H : il n’existe pas d’hétérogénéité cachée : le taux auquel l’événement survient dépend uniquement de la valeur des covariables.

h(t | Z = z) = hZ(t) Z = ( ,...,Z1 Zq)',

(5)

I- Définition et contexte d’utilisation

RQ : Le choix d’ utiliser un modèle avec covariables plutôt que d’étudier chaque sous-populations séparément (à valeur de Z fixée) dépend

Ø  du nombre de valeurs prises par Z et de la taille de la

population : si Z petit et n grand (peu de sous-populations, chacune de taille raisonnable) on pourra étudier ces sous- populations séparément

Ø  De l’objectif de l’étude (comparaison de sous-populations ou non). Si l’on veut comparer les différentes sous populations, on utilisera plutôt un modèle avec covariable

(6)

II- Les modèles classiques

ü  Vocabulaire :

–  Baseline : = fonction pour une situation (valeur z) de référence (correspondant si possible au cas où les covariables sont neutres sur la durée)

–  Fonction de lien : =représente l’effet relatif du vecteur de covariables par rapport à la situation de référence. On connait généralement sa forme paramétrique

ü  2 cas:

-

baseline paramétrique : modèle à covariables paramétrique - Baseline non paramétrique : modèle à covariables semi-

paramétrique

RQ : il est aussi possible d’estimer le lien de façon non-paramétrique (rare) (cf. O’Sullivan 1993)

0 (ou )0

h S

ψ

{ (., ), Rq} ψ ∈ ψ β β ∈

(7)

II- Les modèles classiques

ü  Modèle à hasard proportionel (PH):

z et β ne dépendent pas du temps

Une covariable qui modifie le lien par rapport au niveau de référence induit un effet multiplicatif de même ampleur sur le taux à chaque date t

( / ) ( , ) ( ),0 q, q

h t zz β h t z R∈ β ∈R ψ (0, ) 1β =

(8)

II- Les modèles classiques

Ø  Utilisation :

Permet de modéliser l’effet de certaines variables explicatives agissant multiplicativement sur la loi de la durée de vie (ex : effet du tabac sur la durée de vie)

Interprétation en fiabilité des systèmes:

§ 

(taux de baseline) = fonction de taux du système (de la population) dans des conditions de marche normale ( associées à z=0)

§  Lorsque les covariables induisent un effet

multiplicatif >1 sur le taux : le système vieillit plus vite que dans des conditions normales.

h

0

( , ) 1z ψ β >

(9)

II- Les modèles classiques

Ø  Condition d’utilisation du modèle:

Les sous-populations doivent satisfaire l’hypothèse de Hasard Proportionnel (HP) : le rapport taux de hasard de deux sous- populations ayant des valeurs des covariables différentes est constant dans le temps.

RQ: De facon équivalente, les fonctions de survie sont égales à une puissance près (cf page suivante)

1 2

( / ) ( / ) S t z = S t z α

1 1

2 2

( / ) ( , ) ( / ) ( , )

h t z z

h t z z

ψ β

=ψ β

(10)

II- Les modèles classiques

Ø  Caractéristiques de la loi :

0

( , ) 1

0 0

( , ) 0

0

( / ) ( , ) ( )

( / ) ( ) ( , ) ( ) ( / ) ( )

( / ) ( , ) ( )

z z

h t z z h t

f t z f t z S t S t z S t

H t z z H t

ψ β ψ β

ψ β

ψ β ψ β

=

=

=

=

(11)

II- Les modèles classiques

ü  Modèles à vieillissement accéléré :

z et β ne dépendent pas du temps

Au lieu d’agir sur l’ordonnée de la fonction de hasard

(dilatation verticale),

On modifie ici l’échelle des temps (dilatation horizontale) : la

sous-population

vieillit en retard (ou en avance).

( / ) 0( * ( , ))

S t z = S t ψ z β ψ (0, ) 1β =

(12)

II- Les modèles classiques

Ø  Utilisation :

Lorsqu’on cherche à expliquer l’effet d’un stress sur une sous-

population (exposé à des conditions extrêmes, ou à un traitement s’il s’agit de patients, par ex.)

Interprétation en fiabilité des systèmes:

§  est la fonction de survie du système dans des conditions de marche normale ( i.e. lorsque z=0)

§  Lorsque (resp. ) la survie à t

diminue : le système vieillit plus vite (resp. moins vite) que dans des conditions normales (sans stress)

0( ) S t

( , ) 1z ψ β >

( , ) 1z ψ β <

(13)

II- Les modèles classiques

Ø  Tout se passe comme si, sachant z, la durée d’intérêt était

§  En fiabilité, l’observation dans des conditions de stress est

utilisée pour tester les caractéristiques de systèmes très fiables.

En étudiant la loi de la durée stressée on en déduit celle de T0 correspondant aux conditions normales d’utilisation.

Tz 0 / ( , )

Tz =T ψ z β

(14)

II- Les modèles classiques

Ø  Caractéristiques de la loi de T:

0

0 0 0

( / ) ( * ( , ))

( / ) ( , ) ( * ( , ));

( / ) ( , ) ( * ( , )) ( / ) ( * ( , ))

S t z S t z

f t z z f t z

h t z z h t z

H t z H t z

ψ β

ψ β ψ β

ψ β ψ β

ψ β

=

=

=

=

(15)

II- Les modèles classiques

ü  Formes classiques de liens

-

Log-linéaire (modèle de Cox pour PH)

-

Logistique

-

Linéaire

Vecteur de variables explicatives Vecteur de paramètres

( ,..., )'1 q

z = z z

( ,... )'1 q

β = β β

'z 1 1z ... q qz

β = β + + β

( , ) exp(z ' )z ψ β = −β ( , ) ln(1 ez β'z)

ψ β = + ( , ) 1z 'z ψ β = + β

(16)

II- Modèles classiques

ü  Modélisation de la baseline d’un HP sous forme d’une régression

Où et est un terme d’erreur.

On MQ la loi conditionnelle sachant z de l’erreur est une loi de Gumbel (de fdr K)

Lorsque (modèle de Cox), on a un modèle linéaire généralisé dont on peut estimer le paramètre par MV.

ln( 0( )) Y = H T

( , )z eβ'z

ψ β =

( )

1−K u( ) exp exp( )= − u ln( ( / ))H T z

ε =

ln ( , ) Y = − ψ z β +ε

(17)

III- Estimation paramétrique

Lorsque la forme de la baseline et du lien sont spécifiés :

On estime les paramètres Θ et β par des méthodes paramétriques

0 { (., ),0 p}

SS θ θ ∈R ψ ∈{ (., ),ψ β β ∈Rq}

(18)

III- Estimation paramétrique

ü  Hypothèses :

§  on se place dans une modèle de censure aléatoire droite (conditionnellement à Z)

§  On connait la forme de la baseline :

§  On connait la forme du lien :

Alors on connaît la famille paramétrique à laquelle appartient le taux

ü  Méthode : maximisation de la vraisemblance observable

{ }

(./ ) (., / ), ( , ) p q

h zh υ z υ = θ β ∈ Ω ⊂ R +

0 { (., ),0 p}

hh θ θ ∈R S0 ∈{ (., ),S0 θ θ ∈Rp} { (., ), Rq}

ψ ∈ ψ β β ∈

(19)

III- Estimation paramétrique

ü  Log-vraisemblance observable

Où zi est la valeur du vecteur de covariables observées Z pour le i°

système:

ü  EMV

1 1

1 1

( ,... , / ,..., ) n ln ( , / ) n ( , / )

n n n i i i i i

i i

l o o υ z z δ h x υ z H x υ z

= =

=

( ,..., )1

i i iq

z = z z

1 1

ˆn ( , ) arg maxˆ ˆn n υ l on( ,..., , / ,..., )on z zn

υ = θ β = ∈Ω υ

(20)

III- Estimation paramétrique

ü  Résolution : cf cas sans covariable. l’EMV ne peut généralement pas être obtenu analytiquement. Il faut utiliser l’approximation numérique. Les méthodes sont les mêmes que celles utilisées dans les modèles sans covariable.

ü  Propriétés de l’EMV : cf EMV des modèles sans covariables.

(21)

III- Estimation paramétrique

ü  Applications

§  Modèle de vieillissement accéléré

§  Modèle à hasard proportionnel

( )

1 0 0

1 1

( ,... , , / ) n ln ( , ) ln ( ( , ), ) n ( ( , ), )

n n i i i i i i

i i

l o o θ β z δ ψ z β h xψ z β θ H xψ z β θ

= =

=

+ −

( )

1 0 0

1 1

( ,... , , / ) n ln ( , ) ln ( , ) n ( , ) ( , )

n n i i i i i

i i

l o o θ β z δ ψ z β h x θ ψ z β H x θ

= =

=

+ −

(22)

III- Estimation paramétrique

ü  Exemple

: Modèle de Cox avec baseline exponentielle λ

•  En posant

On a

' 0 0 '

( , , / ) z z z

h t λ β z = λeβ = eβ eβ

h(t,β / z)= exp( βj z j

j=0 q

) = eβ'z

0 0 0

( ,..., )' ;q z ( ,... )',z zq z 1 (covariable de baseline)

β = β β = =

(23)

III- Estimation paramétrique

Ø  Log-vraisemblance observable:

Ø  Equations de vraisemblance:

ln(o1,...,on,β / z) = δiβ 'zi

i=1 n

xieβ'zi

i=1 n

= δiβ j zij

j=0 q i=1

n

xie

βjzij

j=0 q

i=1 n

1 ˆ '

1 1

( ,..., , ˆ / )

0 n n n zi

n n n

i ij i ij

i i

j

l o o z

z x z eβ

β δ

β = =

∂ = = −

∑ ∑

(24)

III- Estimation paramétrique

Ø  Application numérique : On considère une échantillon de n

ampoules électriqtes. On étudie leur durée de vie selon qu ’elles sont ou non soumises à un certain stress multiplicatif. La présence de stress est donnée par une covariable z1 valant 1 si l’ampoule est stressée, o sinon.

ü  On note r0 le nombre de pannes dans le groupe en fonctionnement normal, r1 celui dans le groupe stressé.

Groupe non stressé

Groupe stressé

Nb de pannes

Covariable de baseline z0 Covariable de stress Z1

r0 1 0

R1 1 1

h(t,β01 / z) =eβ0z01z1

(25)

III- Estimation paramétrique

Ø  Log-vraisemblance : ici,

Ø  Résolution :

En posant le taux sous des conditions normales et Le taux sous stress,

0 1 1

1 0 0 0 1 1

1

( ,..., , , ) ( ) n zi

n n i i

i

l o o β z β r β β r x eβ +β

=

= + + −

0= r0 +r1eβ01 xi

i,zi1=1

{

} eβ0 xi

i,zi1=0

{

}

0= r1eβ01 xi

i,zi1=1

{

}

#

$

%

%%

&

%

%

%

0 eβ0

λ = λ1 = eβ0+β1

{ 1 } { }1

0 1

0 1

0 1

ˆ ; ˆ

i i

i i

z z

r r

x x

λ λ

= =

= =

∑ ∑

0 0 1

( , / (1,0)) , ( , / (1,1))

h t β z = = eβ h t β z = = eβ +β

(26)

IV- Estimation semi-paramétrique d’un modèle de HP

ü  L’estimation semi-paramétrique est utilisée

§  lorsqu’on n’a pas d’idée a priori sur la forme paramétrique de la baseline mais que la forme du lien est spécifiée

§  Lorsqu’on est intéressé principalement par l’effet relatif des

covariables sur la durée, plutôt que par la modélisation de sa loi

§  S’utilise essentiellement pour des modèle de HP. On ne sait pas faire dans le cadre général.

(27)

IV- Estimation semi-paramétrique d’un modèle de HP

ü  Hypothèses

Ø  on se place dans un modèle de censure aléatoire droite Ø  Le modèle est un modèle de HP

Ø  Le taux est inconnu

Ø  Le lien a une forme paramétrique connue

la Log-vraisemblance observable est inutilisable puisqu’elle dépend du taux inconnu

h0

( , )z ψ β

h0

(28)

IV- Estimation semi-paramétrique d’un modèle de HP

ü  Idée de la méthode de Cox (1973)

Vraisemblance partielle : Méthode Proposée par Cox (73) pour

éliminer le paramètre nuisible h0 dans le cas où la fonction de lien est exponentielle, puis généralisée dans certains cas (en particulier à tout

autre modèle de HP)

•  Estimation paramétrique de la fonction de lien par maximisation de la vraisemblance partielle.

•  Estimation de la baseline par une méthode d’estimation non- paramétrique .

(29)

IV- Estimation semi-paramétrique d’un modèle de HP :

1- estimation paramétrique du lien

ü  Vraisemblance partielle Hypothèse : absence d’ex-aequos

Où r est le nombre de décès survenant aux temps ,

est le vecteur de covariables associé à l’individu dont le decès survient à , est l’ensemble des individus à risque juste avant

(1) ... ( )r

t < <t

( )i

z

( )i

tR(i) =

{

k / xkt(i)

}

( )i

t

Ln(β)= Ψ(z(i),β) Ψ(z(k),β)

k

R(i)

$

%

&

&

&

'

( )) )

i=1 r

= Ψ(z(i),β) Ψ(z(k),β)

k

R(i)

$

%

&

&

&

'

( )) )

δi

i=1 n

(30)

IV- 1 Estimation semi-paramétrique : d’un modèle de HP

estimation paramétrique du lien

ü  CP du modèle de Cox (Co, 1973): h t z( / , )β = e h tβ'z 0( )

( )

( )

' ' 1

( )

i k i

r z

n z

i

k R

e e

β

β β

=

⎛ ⎞

⎜ ⎟

= ⎜ ⎟

⎜ ⎟

⎝ ⎠

∏ ∑

L

(31)

IV- 1 Estimation semi-paramétrique : d’un modèle de HP

estimation paramétrique du lien

ü  Fondements théoriques

Andersen Borgan Gill Keiding (1993) en utilisant la théorie des processus de comptage

(32)

IV- 1 Estimation semi-paramétrique : d’un modèle de HP

estimation paramétrique du lien

ü  Interprétations

1- Kalbfreisch, Prentice (1980): La vraisemblance partielle de Cox correspond à la vraisemblance des rangs des décès et de

l’emplacement des censures entre ces décès : on ne considère que l’ordre dans lequel les décès surviennent, ce qui est raisonnable car sans connaître la baseline, les temps de décès donnent peu

d’information sur le paramètre.

Dans le cas non censuré et en l’absence d’ex-aequos :

1 1

( )

( ) ( ,..., )

numéro de l'individu correspondant au i° décès : /

n n n

i i j i

P K k K k

K K j T T

β = = =

= = ⇔ =

L

(33)

IV- 1 Estimation semi-paramétrique d’un modèle de HP :

estimation paramétrique du lien

Preuve : On note les caractéristiques de l’individu i.

Cas n=2

i, ,i i

S h f

1 2 2 1 1

0

( , ) ( , ) 1

0 0 0

0

( , ) ( , ) 1

0 0

0

( , ) ( / ) ( )

(le i° individu décède le premier)

( ) ( ) ( )

( , ) ( ) ( ) ( )

( , ) ( ) ( )

( , )

( , ) ( , )

j i

i j

i j j i

z z

i

z z

i

i

i j

P K i K j P K j K i P K i P

P T T S t f t dt

z S t f t S t dt

z S t f t dt

z

z z

β β

β β

β β

β

β β

Ψ Ψ

Ψ +Ψ

= = = = = =

= < =

= Ψ

= Ψ

= Ψ =

Ψ + Ψ

(1)

2

(1) (2)

( , )

( , ) ( , ) ( )

z L

z z

β β

β β

Ψ =

Ψ + Ψ

(34)

IV- 1 Estimation semi-paramétrique d’un

modèle de HP : estimation paramétrique du lien

Cas général

( )

1 1 1 1

1

* 1

* 0 * 0

( 1)

( , ) 1 ( , )

( ) 0 0 0 0

( 1)

L ( ) ( / ,.., )

( min ( )) ; min ( )

( ) ( ) ( ) ( ) ( )

( , ) ( ) ( ) ( )

s j j

s s s

k s

n

n s s s s

s n

k j s k k j s k

s

k k k k k k

k R s

n z z

s

k R s

P K k K k K k

P T T T T

P T T S t f t dt S t f t dt

z S t β f t S t β

β

β

=

> >

=

+

Ψ Ψ

+

= = = =

= < =

⎛ ⎞

< = = ⎜ ⎟

⎝ ⎠

⎛ ⎞

= Ψ ⎜ ⎟

⎝ ⎠

∫ ∫ ∏

∫ ∏

( )

( , ) 1

( )

( ) 0 0 0

( )

( , )

( , ) ( ) ( )

( , )

k k R s

z s

s

k k R s

dt

z S t f t dt z

z

β

β

β β

Ψ

∑ Ψ

= Ψ =

∫ ∑

Ψ

(35)

IV- 1 Estimation semi-paramétrique d’un

modèle de HP : estimation paramétrique du lien

2- Cox (1975): si hO est arbitraire, aucune info ne peut être donnée par des intervalles où aucune mort ne se produit (sur ces

intervalles h0=c) . Seuls les intervalles où se produisent des décès peuvent fournir de l’information sur le paramètre. On devra travailler alors conditionnellement à ces intervalles.

En l’absence d’ex-aequos :

Equivalent à 1- (cf exemple)

1 1 1

(1) (1) ( ) ( )

( ) ( ) ( ) ( ) ( )

( ) 1

( ) ( [x , ),..., [x , ),... [x , ) |

un mort sur [ , ),...,[ , ),...)

( ) ( [t , ) | et une mort entre [ , ))

( ) ( |

n j j j n n n

i i

n j i i i i i

r

n j i

j

P X x dx X x dx X x dx

t t dt t t dt

P T t dt R t t dt

P T t β

β β

=

= ∈ + ∈ + ∈ +

∃ + +

= ∈ + ∃ +

= =

dL

dL

L R( )i et k∃ ∈ R T( )i , k = t( )i )

(36)

IV- 1 Estimation semi-paramétrique d’un

modèle de HP : estimation paramétrique du lien

( )

( )

( ) ( ) ( ) ( ) ( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( ) ( )

( [t , ) | et k , [t , ))

( [t , ) | )

( [t , ) | )

( [t , ) | t )

( [t , ) | t )

( , , )

(

i

i

j i i i i k i i

j i i i

k i i i

j i i j i

k i i k i

i i

P T t dt R R T t dt

P T t dt R

P T t dt R

k R

P T t dt T

P T t dt T

k R

h t z dt h

β

+ ∃ ∈ +

+

= +

+ >

= + >

=

( )

( )

( )

, , )

( , )

( , )

i

i

k k

i k

t z dt k R

z k R z

β β

β

= Ψ

Ψ

(37)

IV- 1 Estimation semi-paramétrique d’un

modèle de HP : estimation paramétrique du lien

ü  Résolution : on cherche le maximum de la log vraisemblance partielle, en utilisant éventuellement les méthodes

d’approximation numériques précitées.

(38)

IV- 1 Estimation semi-paramétrique d’un

modèle de HP : estimation paramétrique du lien

ü  Propriétés asymptotiques de l’EMVP (Tsiatis 81):

•  H1: l’expérience est interrompue à

Ø  existe

Ø  converge presque sûrement vers β Ø 

ˆn

β ˆn

β ˆ 1

( n ) L (0, ( ))

n β −β ⎯⎯→N Σ β

1

1 ,1

²

1 ˆ

où est estimée par ˆn n ( ,..., ,n n)

k j k p j p

o o

n β

β β ≤ ≤ ≤ ≤

⎡ ∂ ⎤

Σ Σ = − ⎢ ⎥

⎢∂ ∂ ⎥

⎣ ⎦

l

/ ( ) 0 et G( ) 1S

τ τ > τ =

(39)

IV- 1 Estimation semi-paramétrique d’un

modèle de HP : estimation paramétrique du lien

ü  Exemple : On considère 3 individus. Les deux premiers ont plus de 40 ans et le troisième moins de 40 ans. On considère une seule covariable z1, valant 0 pour un individu de moins de 40 ans et 1 sinon. On veut savoir si l’âge a une influence sur la durée de séjour en situation de chômage (en semaines). On ne connaît pas la distribution de base (baseline). On suppose que la durée suit un modèle de Cox. On doit estimer un seul coefficient. On sait que t1=80, t2=20, t3=50.

R(1)={1,2,3} ; R(2)={1,3} ; R(3)={1}

N° T Z1

1 80 1

2 20 1

3 50 0

(40)

IV- 1 Estimation semi-paramétrique d’un

modèle de HP : estimation paramétrique du lien

ü  Calcul de la log-vraisemblance partielle

ü  Utilisation de l’interprétation 1)

•  On définit le vecteur de rang {2,3,1}.

•  On montre que

( ) ( )

3

1

( )

( ) * 1 *

2 1 1

i k

z

n z

i

k R i

e e e

e e e

e

β β β

β β β β

β

=

= =

+ +

∏ ∑

L

1 2 3 1 2 1 3 1 2

( 2, 3, 1) ( 2) ( 3/ 2) ( 1/ 2, 3)

P R = R = R = = P R = P R = R = P R = R = R =

12 13

13 13

11 12 11

1 2 3

( 2, 3, 1) * * 1

2 1 1

z z

z z

z z z

e e e

P R R R

e e e e e e e

β

β β

β β

β β β β β

= = = = =

+ + + + +

(41)

IV- 1 Estimation semi-paramétrique d’un

modèle de HP : estimation paramétrique du lien

•  En effet P(R1 = 2)

= P(l'individu 2 sort à T = 20 / R(1) ={1,2,3} et ∃ un item de R(1) sortant à T = 20)

= h(20,z21)

h(20,z11)+h(20,z21)+ h(20,z31) = ψ(β,z21)

ψ(β,z11)+ψ(β,z21)+ψ(β,z31)

2 1 2 1 (2)

1 1

3 3

1 1 1 1

1 3 1 3

( 3/ 2) ( 3/ 2, 50)

(l'individu 3 sort à 50 / (2) {1,3}, un item de R(2) sortant à 50)

(50, ) ( , )

(50, ) (50, ) ( , ) ( , )

P R R P R R T

P T R T

h z z

h z h z z z

ψ β

ψ β ψ β

= = = = = =

= = = ∃ =

= =

+ +

(42)

IV- 1 Estimation semi-paramétrique d’un

modèle de HP : estimation paramétrique du lien

ü  Résolution

:

On trouve par des méthodes numériques

:

> time=c(20,50,80); status=c(1,1,1); z1=c(1,0,1); hp=coxph(Surv(time, status)~z1); hp

Call: coxph(formula = Surv(time, status) ~ z1) coef exp(coef) se(coef) z p

z1 -0.347 0.707 1.44 -0.241 0.81

Likelihood ratio test=0.06 on 1 df, p=0.81 n= 3 L’effet de l’âge est négatif : le fait d’être plus vieux

applique un facteur multiplicatif de 70% sur le taux (il diminue son taux de sortie 30%)

( ) ln(2 1) ln( 1)

( ) 1 2 0

2 1 1

n n

e e

e e

e e

β β

β β

β β

β β β β

= − + − +

∂ = − − =

∂ + +

l l

ˆn 0.347 β = −

(43)

IV- 1 Estimation semi-paramétrique d’un

modèle de HP : estimation paramétrique du lien

ü  Estimation du lien en présence d’ ex-aequos (modèle de Cox)

- = nombre de pannes à

- = ensemble de tous les sous-ensembles de taille pouvant être constitués à partir des individus de

( )

'

( ) ( ) '

tombe à | ( ) pannes à

k k qi

k k qk

k i

z

i i i i z

q Q

P k q t R i et d t e

e

β

β

∈ =

di t( )i

Qi di

( )i

R i q

(44)

IV- 1 Estimation semi-paramétrique d’un

modèle de HP : estimation paramétrique du lien

ü  Vraisemblance partielle exacte (difficile à calculer):

ü  Vraisemblance partielle de Breslow:

ü  Vraisemblance partielle d’Efron:

'

1 '

( )

k k qi

k k qk

k i

z r

n z

i

q Q

e e

β

β β

=

=

L

( )

'

1 '

( )

k k qi

i k

i

z r

d

i z

k R

e e

β

β

β

=

=

⎛ ⎞

⎜ ⎟

⎜ ⎟

⎝ ⎠

B

Ln

( )

'

1 ' '

1

( )

1

k k qi

i

k m

i i

z r

i d

z z

k R m q

l i

e

e l e

d

β

β β

β

=

=

=

⎛ − ⎞

⎜ − ⎟

⎜ ⎟

⎝ ⎠

∑ ∑

E

Ln

(45)

IV- Estimation semi-paramétrique

2- Estimation non-paramétrique de la baseline

Cas de Cox (pas d’ex-aequo)

= maximum de vraisemblance partielle

ü  Kalbfreisch, Prentice (1980):

fonction de survie estimée (cst par morceaux)

= maximum non paramétrique de la vraisemblance observable,

ü  Breslow (1972)

fonction de hasard estimée (cst par morceaux)

= maximum non paramétrique de la vraisemblance observable

( )

( ) ( )

0 0 0 (1) ( )

{ }

ˆ ˆ ' exp( ' )

ˆ ' ( )

ˆ ( ) ˆ , ˆ 1, 0 ... morts

ˆ 1

i

n i

n i

n k

i r

T t

z z

i z

k R i

S t T T T

e e

β β

β

α α

α

= = = < < <

⎛ ⎞

⎜ ⎟

= ⎜ − ⎟

⎜ ⎟

⎝ ⎠

Sˆ0(t) = eHˆ0(t)

Hˆ0(t) = γˆi,

T

(i)≤t γˆi = δ(i)eβˆn'zk

k∈

R(i) i 0, ˆγ0 = 0 ˆn

β

(46)

IV- Estimation semi-paramétrique

2- Estimation non-paramétrique de la baseline

Cas général (pas d’ex-aequo) instants de morts

ü  Kalbfreisch, Prentice :

ü  Breslow :

( )

( )

0 0

{ }

( , ˆ ) ( )

( )

ˆ ( ) ˆ , ˆ 1

( , ˆ )

ˆ 1

( , ˆ )

i

i n

i

T t

z i n

i

k n

k R i

S t

z z

β

α α α β

β

Ψ

= =

= − Ψ

Ψ

Sˆ*0(t) = eHˆ0(t)

Hˆ0(t) = γˆi, ˆγi = δ(i)

Ψ(zk, ˆβn)

k∈

R(i) i 0, ˆγ0 = 0 T

(i)≤t

(0) 0 (1) ... ( )r

T = <T < <T

(47)

IV- Estimation semi-paramétrique

2- Estimation non-paramétrique de la baseline

ü  Exemple : On considère 3 individus. Les deux premiers ont plus de 40 ans et le troisième moins de 40 ans. On considère une seule covariable z1, valant 0 pour un individu de moins de 40 ans et 1 sinon. On veut savoir l’âge a une influence sur la durée de séjour en situation de chômage (en semaines). On ne connaît pas la distribution de base (baseline). On suppose que le taux suit un modèle de Cox.On doit estimer un seul coefficient. On sait que t1=80, t2=20, t3=50.

R(1)={1,2,3} ; R(2)={1,3} ; R(3)={1}

N° T Z1

1 80 1

2 20 1

3 50 0

(48)

IV- Estimation semi-paramétrique

2- Estimation non-paramétrique de la baseline

ü  Prentice

> ss=survfit(hp, type="kaplan-meier"); summary(ss) Call: survfit.coxph(object = hp, type = "kaplan-meier")

time n.risk n.event survival std.err lower 95% CI upper 95% CI 20 3 1 0.678 0.266 0.314 1

50 2 1 0.337 0.285 0.064 1 80 1 1 0.000 0.000 0.000 0

ˆ

ˆ

0 ˆ

0 1 ˆ

0

ˆ

0 1 2 ˆ ˆ

0 1 2 3

ˆ 1 20

ˆ ˆ 1 0.612 20 50

2 1

ˆ ( )

ˆ ˆ ˆ 1 1 1 0.254 50 80

2 1 1

ˆ ˆ ˆ ˆ 0 80

e

e

t

e t

S t e

e t

e e

t

β

β

β β

β

β β

α α α

α α α

α α α α

= <

⎧⎪

⎪ ⎛ ⎞

= − = ≤ <

⎪ ⎜⎜ + ⎟⎟

⎪ ⎝ ⎠

= ⎨

⎪ ⎛ ⎞ ⎛ ⎞

⎪ = ⎜⎜ − + ⎟⎟ ⎜⎝ − + ⎟⎠ = ≤ <

⎪ ⎝ ⎠

⎪ = ≥

⎩

Sˆ(t) = Sˆ0(t)eβzˆ = Sˆ0(t)e2 ˆβ/3

(49)

IV- Estimation semi-paramétrique

2- Estimation non-paramétrique de la baseline

ü  Breslow

ss2=survfit(hp, type="fleming-harringon"); summary(ss2) Call: survfit.coxph(object = hp, type = "fleming-harringon") time n.risk n.event survival std.err lower 95% CI upper 95% CI 20 3 1 0.720 0.238 0.3763 1

50 2 1 0.452 0.274 0.1379 1 80 1 1 0.147 0.192 0.0115 1

Sˆ*0(t) =

e−γ0 =1 t < 20 e−γ0γ1 = e

1

2eβˆ+1 = 0.661 20≤ t < 50 e−γ0−γ1γ2 = e

1

2eβˆ+1 1

eβˆ+1 = 0.368 50≤ t < 80 e−γ0−γ1γ2γ3 = e

1

2eβˆ+1 1 eβˆ+1 1

eβˆ = 0.089 t ≥ 80

$

%

&

&

&&

'

&

&

&

&

ˆ 2 / 3ˆ

* * *

0 0

ˆ ( ) ( )e z ( )e S t = S t β = S t β

(50)

V- Autres modèles avec covriables

Le modèle de HP n’est plus applicable lorsque l’hypothèse de HP n’est pas vérifiée

Alternatives :

ü  Modèles stratifiés

ü  Modèles avec covariables dépendant du temps ü  Modèles à risques concurrents

ü  ……….

(51)

V- Autres modèles 1- modèles stratifiés

Quand?

ü  Une covariable dépend du temps et/ou n’a pas un effet multiplicatif sur le taux).

ü  On ne veut pas estimer l’effet de cette covariable sur le taux Ex : Au lieu de supposer que l’effet du sexe sur la survie est

constant dans le temps et multiplicatif sur le risque comme dans un modèle de HP, on peut considérer que c’est le risque de base qui est différent chez les hommes et chez les femmes. On dit alors qu’on a un modèle de Cox stratifié : chaque sexe définit une strate.

(52)

V- Autres modèles 1- modèles stratifiés

Soit Y une variable à m states (niveaux) :

On suppose que c’est le risque de baseline qui diffère sur les strate et non le lien

On obtient un modèle stratifié en appliquant un modèle de HP par strate; un système de la strate m a pour taux :

Seule la baseline change selon la strate. L’effet relatif de chaque covariable est supposé être le même dans chaque strate.

{ ,... }1 m

Yy y

( , / ) ( , ) ( )

m m

h t β zz β h t 1,..., ,

l m

∀ =

(53)

V- Autres modèles 1- modèles stratifiés

•  Vraisemblance partielle:

•  Inconvénients:

-  l’effet de la covariable stratifiée n’est pas mesuré dans ce modèle.

-  La précision des estimations des coefficients diminue avec le nombre de strates

1

( ) ( )

où ( ) est la vraisemblance partielle de la strate l

m n

l

β β

β

=

=

mn

m n

L L

L

(54)

V- Autres modèles

2- Covariables dépendant du temps

Lorsque HP n’est pas vérifié, on peut autoriser les covariables à dépendre du temps

Hypothèse : absence d’ex-aequos.

Les coefficients se trouvent en maximisant la vraisemblance partielle

Sous de bonnes conditions, même propriétés asymptotiques de l’estimateur.

( )

( ) ( ) 1

1 ( ) ( )

( , , )

( ,..., , )

( , , )

i

r i i

n n

i k k

k R

t t z t

z t β β

= β

⎛ ⎞

⎜ Ψ ⎟

= ⎜⎜ Ψ ⎟⎟

⎝ ⎠

∏ ∑

L

(55)

V- Autres modèles

3- Modèle de HP discret

Lorsqu’il y a beaucoup d’ex-aequos, on peut utiliser un modèle de HP à temps discret. On suppose que les données sont groupée en intervalles Ij=(a(j-1), aj], j=2,…k I0=[0, a1], I(k+1)=(ak,…). Les instants de décès exacts sont alors inconnus. Seul est jugé pertinent l’indice j de

l’intervalle dans lequel se produit l’évènement (décès ou censure). On suppose que le processus des covariables est constant sur un intervalle Ij et égal à zj On a :

1

1

1 1

1

exp( ' ) 0

1 exp( ' )

0 1

( | ) ( | )

( | , )

( | ) exp( ( / )

1 1 exp ( )

exp( ( / ) 1 (1 )

1 exp ( ) ( | , 0)

j j

j

j

j j

j j

j j

j a z j

j a

z j

a

j a j j

S a z S a z P T I T a z

S a z H a z

h t dt H a z

h t dt P T I T a z

β

λ β

λ

∈ > = −

− ⎛ ⎛ ⎞⎞

= − = −⎜ ⎜ ⎟⎟

− ⎝ ⎝ ⎠⎠

= − −

⎛ ⎞

= − ⎜ ⎟ = ∈ > =

⎝ ⎠

(56)

V- Autres modèles

3- Modèle de HP discret

(57)

V- Autres modèles

3- Modèle de HP discret

Références

Documents relatifs

We report the results of microarray hybridization experi- ments performed with probes derived from whole leaves as well as from epidermal and mesophyll prep- arations of sylA

This scheme treats different degrees of freedom, such as high-energy and low-energy bands, or local and nonlocal interactions, within appro- priate levels of approximation, and

Le décentrement culturel que nous imposent les pays intermédiaires remet en lumière l‘importance des apparences et de l‘habitus dans les pratiques de l‘espace

L’absence d’une substituabilité parfaite est préférable pour représenter des fonctions exclusives à un usage de la terre (la fonction alimentaire de l’usage agricole) par

Les valeurs obtenues pour les quantités d’ADN chez les espèces diploïdes varient de 0.92 pg/2C chez Astragalus epiglottis à 4.79 pg/2C chez Astragalus cedreti alors que la taille

Study of the impact of climate change on precipitation in Paris area using a method based on iterative multi scale dynamic time warping (IMs-DTW).. 9th International Workshop on

Par conséquent la suggestion de Dolado, Jenkinson et Sosvilla-Rivero ne doit pas être considérée autrement que comme un signal d'alarme révélant, sous l'hypothèse nulle de la

Bien que notre pays figure dans la moyenne des scores des pays de l’O.C.D.E., l’analyse des résultats des évaluations internationales (PIRLS 2 , PISA 3 ) montre nettement