• Aucun résultat trouvé

Em muitas aplica¸c˜oes pr´aticas, os tempos de vida s˜ao afetados por vari´aveis que s˜ao referidas como vari´aveis explanat´orias ou covari´aveis, tais como, o n´ıvel de colesterol, a press˜ao sangu´ınea, a idade e muitas outras. Assim, ´e importante explorar a rela¸c˜ao entre o tempo de vida e vari´aveis explanat´orias. Uma abordagem baseada em um modelo de regress˜ao pode ser usada.

Seja x = (x1, . . . , xp)T um vetor de vari´aveis explanat´orias associadas `a vari´avel

resposta Y . Com base na densidade LOLLW, pode-se construir um modelo de regress˜ao linear (log-linear para T ), ligando a vari´avel resposta yi e o vetor de vari´aveis explanat´orias

xi, como segue:

yi= xTi β+ σzi, i = 1, . . . , n. (3.19)

O erro aleat´orio zi tem densidade (3.6), β = (β1, . . . , βp)T, σ > 0 e α > 0 s˜ao os

parˆametros desconhecidos do modelo e xT

i = (xi1, . . . , xip)T ´e o vetor de vari´aveis expla-

nat´orias que modela o parˆametro de loca¸c˜ao µi. Note que os parˆametros σ e µ controlam

a escala e a forma da distribui¸c˜ao, respectivamente. Assim, o vetor de parˆametros de loca¸c˜ao µ = (µ1, . . . , µn)T do modelo de regress˜ao LOLLW pode ser expresso como um

modelo linear µ = Xβ, em que X = (x1, . . . , xn)T ´e uma matriz conhecida do modelo.

Usando o modelo log-linear em (3.19), a fun¸c˜ao de sobrevivˆencia de Yi|x ´e dada por

S(yi|x) = 1 − n 1 − exph− expyi−xTiβ σ ioα n 1 − exph− expyi−xTiβ σ ioα +nexph− expyi−xTiβ σ ioα. (3.20)

Para o modelo (3.19), tem-se os seguintes casos especiais:

• σ = 1, ent˜ao o modelo (3.19) reduz-se ao modelo de regress˜ao log-odd log-Log´ıstico Exponencial;

• α = 1, tem-se o modelo de regress˜ao log-Weibull (LW); • α = σ = 1, obt´em-se o modelo de regress˜ao log-Exponecial.

3.4.1 Estima¸c˜ao por m´axima verossimilhan¸ca

Considere uma amostra aleat´oria (y1, x1), (y2, x2), . . . , (yn, xn) de n observa¸c˜oes, em

que yi = min{log(Ti), log(Ci)} e xi ´e o vetor de vari´aveis explanat´orias, associado com o

i-´esimo indiv´ıduo e θ = (α, σ, βT)T ´e o vetor de parˆametros. O logaritmo da fun¸c˜ao de

verossimilhan¸ca assumindo censura `a direita ´e dado por

l(θ) =X i∈F l1(α, zi) + X i∈C l2(α, zi), (3.21) em que l1(α, zi) = log " α σ

exp(zi) {exp[− exp(zi)]}α{1 − exp[− exp(zi)]}α−1

{{1 − exp[− exp(zi)]}α+ {exp[− exp(zi)]}α}2

# , l2(α, zi) = log " 1 − {1 − exp[− exp(zi)]} α

{1 − exp[− exp(zi)]}α+ {exp[− exp(zi)]}α

# ,

zi = (yi− xTi β)/σ, F representa o conjunto de indiv´ıduos n˜ao-censurados e C representa

o conjunto de indiv´ıduos com censura `a direita.

O logaritmo da fun¸c˜ao de verossimilhan¸ca pode ser maximizado diretamente usando o SAS (proc NLMixed), o R (optim) ou a rotina MaxBFGS do programa de linguagem matricial Ox (ver DOORNIK, 2007). Os valores iniciais para σ e β podem ser tomados do ajuste do modelo de regress˜ao LW com α = 1. O ajuste do modelo de regress˜ao LOLLW produz a fun¸c˜ao de sobrevivˆencia estimada para yi dada por

b

S(yi; ˆα, ˆσ, bβ T

) = 1 − {1 − exp[− exp(zi)]}ˆα

{1 − exp[− exp(zi)]}ˆα+ {exp[− exp(zi)]}α

, (3.22) em que ˆzi = yi−x T i b β ˆ σ .

Para obten¸c˜ao de intervalos de confian¸ca e testes de hip´oteses sobre os parˆametros do modelo, necessita-se da matriz de informa¸c˜ao observada J = J(θ) de ordem (p+3)×(p+3). Sob certas condi¸c˜oes de regularidade para os parˆametros, a distribui¸c˜ao assint´otica de √

n(bθ−θ) ´e Np+3(0, I(θ)−1), em que I(θ) ´e a matriz de informa¸c˜ao esperada. Na pr´atica,

avaliada em bθ (diga-se J(bθ)).

A matriz de informa¸c˜ao observada pode ser expressa como

−¨J(θ) =    ¨ Jαα J¨ασ J¨αβj . J¨σσ J¨σβj . . J¨βjβs    ,

em que as submatrizes podem ser obtidas a partir do autor, a pedido. As regi˜oes de con- fian¸ca aproximadas para os parˆametros podem ser constru´ıdas baseadas na distribui¸c˜ao Normal multivariada Np+3(0, J(bθ)−1). Al´em disso, a estat´ıstica da raz˜ao de verossimi-

lhan¸ca (RV), pode ser usada para comparar o modelo LOLLW com seus submodelos. Para realizar essas compara¸c˜oes, pode-se calcular os valores m´aximos do logaritmo das verossimilhan¸cas do modelo base e do modelo geral e construir a estat´ıstica de RV. Por exemplo, o teste de H0 : α = 1 versus H : H0 n˜ao ´e verdadeira, ´e equivalente a comparar

os modelos de regress˜ao LOLLW e LW, e a estat´ıstica de RV reduz-se a W = 2{ℓ(ˆθ) − ℓ(˜θ)},

em que ˆθ e ˜θ s˜ao os EMV sob H e H0, respectivamente. Para grandes amostras, W tem

aproximadamente uma distribui¸c˜ao Qui-quadrado com 1 grau de liberdade.

Para interpreta¸c˜ao dos coeficientes estimados, uma poss´ıvel proposta ´e baseada na raz˜ao dos tempos medianos. Portanto, quando a vari´avel explanat´oria ´e bin´aria (0 ou 1) e considerando a raz˜ao dos tempos medianos com x = 1 no numerador, se ˆβ ´e negativo (positivo), isso implica que os indiv´ıduos com x = 1 apresentam decr´escimo (acr´escimo) do tempo de sobrevivˆencia mediano [exp( ˆβ)×100%] com rela¸c˜ao aos indiv´ıduos do grupo com x = 0, desconsiderando os efeitos das outras vari´aveis explanat´orias. Esta interpreta¸c˜ao pode ser estendida para vari´aveis cont´ınuas ou categ´oricas.

3.4.2 Estudo de simula¸c˜ao

Um estudo de simula¸c˜ao de Monte Carlo foi conduzido para avaliar o comportamento sobre amostra finita dos EMV de α, σ e β. Obteve-se resultados de 1.000 simula¸c˜oes de Monte Carlo, realizadas usando a linguagem de programa¸c˜ao Ox (ver DOORNIK, 2007). Em cada r´eplica, uma amostra aleat´oria de tamanho n ´e obtida a partir da distribui¸c˜ao LOLLW(α, σ, β) e os parˆametros s˜ao estimados pelo m´etodo da m´axima verossimilhan¸ca. Os logaritmos dos tempos de vida, denotados por log(t1), ..., log(tn), foram gerados do

modelo de regress˜ao LOLLW (3.19), em que xT

i β = β0 + β1xi, com xi gerada de uma

distribui¸c˜ao Uniforme no intervalo [0, 1]. Os tempos de censura c1, ..., cnforam gerados de

configura¸c˜ao de n, α, σ, β0, β1 e porcentagens de censura, 1000 amostras foram geradas.

Para cada conjunto de dados gerados, ajustou-se o modelo de regress˜ao LOLLW (3.19), em que µi = β0+ β1xi.

No presente trabalho, realizou-se um estudo de simula¸c˜ao considerando n = 100, 200 e 500, α = σ = 0, 5, β0 = 2, β1 = 3 e porcentagens de censura iguais a 0%, 10% e 30%.

A partir da Tabela 3.1, observa-se que o aumento das porcentagens de censura provoca o aumento dos erros quadr´atico m´edio. Tamb´em, os erros quadr´atico m´edio decrescem `a medida que o tamanho da amostra aumenta, como esperado. Percebe-se que h´a um vi´es amostral pequeno na estima¸c˜ao dos parˆametros dos modelos de regress˜ao LOLLW.

Tabela 3.1 - M´edias e Erros Quadr´atico M´edio (E.Q.M.) dos EMV dos parˆametros da distribui¸c˜ao LOLLW n Parˆametro 0% 10% 30% α 0,6237(0,0265) 0,6294(0,0288) 0,6353(0,0357) 100 σ 0,5937(0,0161) 0,5972(0,0175) 0,5991(0,0232) β0 2,0080(0,0144) 2,0044(0,0164) 2,0001(0,0237) β1 2,9948(0,0305) 2,9993(0,0392) 3,0040(0,0611) α 0,5836(0,0109) 0,5870(0,0121) 0,5978(0,0166) 200 σ 0,5668(0,0071) 0,5693(0,0078) 0,5787(0,0112) β0 1,9989(0,0065) 2,0009(0,0006) 2,0030(0,0086) β1 2,9993(0,0124) 2,9987(0,0125) 2,9931(0,0213) α 0,5528(0,0040) 0,5566(0,0048) 0,5629(0,0057) 500 σ 0,5443(0,0028) 0,5474(0,0032) 0,5535(0,0042) β0 2,0015(0,0016) 1,9999(0,0018) 1,9999(0,0024) β1 2,9966(0,0026) 2,9966(0,0032) 2,9943(0,0050) 3.4.3 Probabilidade de cobertura

Para verifica¸c˜ao das probabilidades de cobertura foram constru´ıdos intervalos de confian¸ca para os parˆametros. O estudo de simula¸c˜ao ´e realizado para n = 100, 200 e 300 com α = 1, 2, σ = 1, 5, β0 = 2, β1 = 3 e porcentagens de censura 0%, 10% e 30%.

Foram determinados 3.000 intervalos de confian¸ca, com um n´ıvel de 95%, baseados nas estimativas de m´axima verossimilhan¸ca obtidas para cada configura¸c˜ao de n e porcen- tagens de observa¸c˜oes censuradas. Ainda, calculou-se quantos intervalos continham os verdadeiros valores dos parˆametros para cada configura¸c˜ao especificada. As porcentagens de cobertura s˜ao dadas por: ((3.000 - no de intervalos que n˜ao contem o verdadeiro valor

do parˆametro)/3.000)×100%.

Para cada configura¸c˜ao apresentadas na Tabela 3.2, conclui-se que:

• Se consideradas observa¸c˜oes n˜ao censuradas, as probabilidades de coberturas tendem a aumentar `a medida que o tamanho amostral aumenta, como esperado;

• Se a porcentagem de observa¸c˜oes censuradas mudam, observa-se que h´a um pequeno efeito sobre as probabilidades de cobertura.

Tabela 3.2 - Porcentagens de cobertura dos EMVs dos parˆametros do modelo de regress˜ao LOLLW n Parˆametro 0% 10% 30% α 95,87% 95,47% 94,13% 100 σ 94,83% 94,43% 93,17% β0 95,53% 95,20% 95,50% β1 93,77% 94,50% 93,67% α 95,63% 96,83% 96,70% 200 σ 95,57% 97,20% 96,20% β0 95,50% 95,77% 95,73% β1 95,43% 94,97% 95,20% α 95,53% 97,77% 97,27% 300 σ 95,43% 97,47% 96,90% β0 95,23% 95,90% 96,03% β1 95,33% 95,83% 95,20%

Documents relatifs