GENERALITES - CONVENTION L ENTENTE ASSURANCES K42 MODULO AUTO VIP PLUS CONTRAT N

Em muitas aplica¸cões práticas, os tempos de vida são afetados por variáveis que são referidas como variáveis explanatórias ou covariáveis, tais como, o n´ıvel de colesterol, a pressão sangu´ınea, a idade e muitas outras. Assim, é importante explorar a rela¸cão entre o tempo de vida e variáveis explanatórias. Uma abordagem baseada em um modelo de regressão pode ser usada.

Seja x = (x1, . . . , xp)T um vetor de variáveis explanatórias associadas à variável

resposta Y . Com base na densidade LOLLW, pode-se construir um modelo de regressão linear (log-linear para T ), ligando a variável resposta yi e o vetor de variáveis explanatórias

xi, como segue:

yi= xTi β+ σzi, i = 1, . . . , n. (3.19)

O erro aleat´orio zi tem densidade (3.6), β = (β1, . . . , βp)T, σ > 0 e α > 0 s˜ao os

parˆametros desconhecidos do modelo e xT

i = (xi1, . . . , xip)T ´e o vetor de vari´aveis expla-

natórias que modela o parâmetro de loca¸cão µi. Note que os parâmetros σ e µ controlam

a escala e a forma da distribui¸cão, respectivamente. Assim, o vetor de parâmetros de loca¸cão µ = (µ1, . . . , µn)T do modelo de regressão LOLLW pode ser expresso como um

modelo linear µ = Xβ, em que X = (x1, . . . , xn)T ´e uma matriz conhecida do modelo.

Usando o modelo log-linear em (3.19), a fun¸cão de sobrevivência de Yi|x é dada por

S(yi|x) = 1 − n 1 − exph− expyi−xTiβ σ ioα n 1 − exph− expyi−xTiβ σ ioα +nexph_{− exp}yi−xTiβ σ ioα. (3.20)

Para o modelo (3.19), tem-se os seguintes casos especiais:

• σ = 1, ent˜ao o modelo (3.19) reduz-se ao modelo de regress˜ao log-odd log-Log´ıstico Exponencial;

• α = 1, tem-se o modelo de regressão log-Weibull (LW); • α = σ = 1, obtém-se o modelo de regressão log-Exponecial.

3.4.1 Estima¸c˜ao por m´axima verossimilhan¸ca

Considere uma amostra aleat´oria (y1, x1), (y2, x2), . . . , (yn, xn) de n observa¸c˜oes, em

que yi = min{log(Ti), log(Ci)} e xi é o vetor de variáveis explanatórias, associado com o

i-ésimo indiv´ıduo e θ = (α, σ, βT)T _{é o vetor de parâmetros. O logaritmo da fun¸cão de}

verossimilhan¸ca assumindo censura `a direita ´e dado por

l(θ) =X i∈F l1(α, zi) + X i∈C l2(α, zi), (3.21) em que l1(α, zi) = log " α σ

exp(zi) {exp[− exp(zi)]}α{1 − exp[− exp(zi)]}α−1

{{1 − exp[− exp(zi)]}α+ {exp[− exp(zi)]}α}2

# , l2(α, zi) = log " 1 − {1 − exp[− exp(zi)]} α

{1 − exp[− exp(zi)]}α+ {exp[− exp(zi)]}α

# ,

zi = (yi− xTi β)/σ, F representa o conjunto de indiv´ıduos n˜ao-censurados e C representa

o conjunto de indiv´ıduos com censura `a direita.

O logaritmo da fun¸cão de verossimilhan¸ca pode ser maximizado diretamente usando o SAS (proc NLMixed), o R (optim) ou a rotina MaxBFGS do programa de linguagem matricial Ox (ver DOORNIK, 2007). Os valores iniciais para σ e β podem ser tomados do ajuste do modelo de regressão LW com α = 1. O ajuste do modelo de regressão LOLLW produz a fun¸cão de sobrevivência estimada para yi dada por

S(yi; ˆα, ˆσ, bβ T

) = 1 − {1 − exp[− exp(zi)]}ˆα

{1 − exp[− exp(zi)]}ˆα+ {exp[− exp(zi)]}α

, (3.22) em que ˆzi = yi−x T i b β ˆ σ .

Para obten¸cão de intervalos de confian¸ca e testes de hipóteses sobre os parâmetros do modelo, necessita-se da matriz de informa¸cão observada J = J(θ) de ordem (p+3)×(p+3). Sob certas condi¸cões de regularidade para os parâmetros, a distribui¸cão assintótica de √

n(bθ_{−θ) é N}_p+3(0, I(θ)−1_{), em que I(θ) é a matriz de informa¸cão esperada. Na prática,}

avaliada em bθ (diga-se J(bθ)).

A matriz de informa¸c˜ao observada pode ser expressa como

−¨J(θ) =    ¨ Jαα J¨ασ J¨αβj . J¨σσ J¨σβj . . J¨βjβs    ,

em que as submatrizes podem ser obtidas a partir do autor, a pedido. As regiões de confian¸ca aproximadas para os parâmetros podem ser constru´ıdas baseadas na distribui¸cão Normal multivariada Np+3(0, J(bθ)−1). Além disso, a estat´ıstica da razão de verossimi-

lhan¸ca (RV), pode ser usada para comparar o modelo LOLLW com seus submodelos. Para realizar essas compara¸cões, pode-se calcular os valores máximos do logaritmo das verossimilhan¸cas do modelo base e do modelo geral e construir a estat´ıstica de RV. Por exemplo, o teste de H0 : α = 1 versus H : H0 não é verdadeira, é equivalente a comparar

os modelos de regress˜ao LOLLW e LW, e a estat´ıstica de RV reduz-se a W = 2{ℓ(ˆθ) − ℓ(˜θ)},

em que ˆθ e ˜θ s˜ao os EMV sob H e H0, respectivamente. Para grandes amostras, W tem

aproximadamente uma distribui¸c˜ao Qui-quadrado com 1 grau de liberdade.

Para interpreta¸cão dos coeficientes estimados, uma poss´ıvel proposta é baseada na razão dos tempos medianos. Portanto, quando a variável explanatória é binária (0 ou 1) e considerando a razão dos tempos medianos com x = 1 no numerador, se ˆβ é negativo (positivo), isso implica que os indiv´ıduos com x = 1 apresentam decréscimo (acréscimo) do tempo de sobrevivência mediano [exp( ˆ_{β)×100%] com rela¸cão aos indiv´ıduos do grupo com} x = 0, desconsiderando os efeitos das outras variáveis explanatórias. Esta interpreta¸cão pode ser estendida para variáveis cont´ınuas ou categóricas.

3.4.2 Estudo de simula¸c˜ao

Um estudo de simula¸cão de Monte Carlo foi conduzido para avaliar o comportamento sobre amostra finita dos EMV de α, σ e β. Obteve-se resultados de 1.000 simula¸cões de Monte Carlo, realizadas usando a linguagem de programa¸cão Ox (ver DOORNIK, 2007). Em cada réplica, uma amostra aleatória de tamanho n é obtida a partir da distribui¸cão LOLLW(α, σ, β) e os parâmetros são estimados pelo método da máxima verossimilhan¸ca. Os logaritmos dos tempos de vida, denotados por log(t1), ..., log(tn), foram gerados do

modelo de regress˜ao LOLLW (3.19), em que xT

i β = β0 + β1xi, com xi gerada de uma

distribui¸c˜ao Uniforme no intervalo [0, 1]. Os tempos de censura c1, ..., cnforam gerados de

configura¸c˜ao de n, α, σ, β0, β1 e porcentagens de censura, 1000 amostras foram geradas.

Para cada conjunto de dados gerados, ajustou-se o modelo de regress˜ao LOLLW (3.19), em que µi = β0+ β1xi.

No presente trabalho, realizou-se um estudo de simula¸c˜ao considerando n = 100, 200 e 500, α = σ = 0, 5, β0 = 2, β1 = 3 e porcentagens de censura iguais a 0%, 10% e 30%.

A partir da Tabela 3.1, observa-se que o aumento das porcentagens de censura provoca o aumento dos erros quadrático médio. Também, os erros quadrático médio decrescem à medida que o tamanho da amostra aumenta, como esperado. Percebe-se que há um viés amostral pequeno na estima¸cão dos parâmetros dos modelos de regressão LOLLW.

Tabela 3.1 - Médias e Erros Quadrático Médio (E.Q.M.) dos EMV dos parâmetros da distribui¸cão LOLLW n Parâmetro 0% 10% 30% α 0,6237(0,0265) 0,6294(0,0288) 0,6353(0,0357) 100 σ 0,5937(0,0161) 0,5972(0,0175) 0,5991(0,0232) β0 2,0080(0,0144) 2,0044(0,0164) 2,0001(0,0237) β1 2,9948(0,0305) 2,9993(0,0392) 3,0040(0,0611) α 0,5836(0,0109) 0,5870(0,0121) 0,5978(0,0166) 200 σ 0,5668(0,0071) 0,5693(0,0078) 0,5787(0,0112) β0 1,9989(0,0065) 2,0009(0,0006) 2,0030(0,0086) β1 2,9993(0,0124) 2,9987(0,0125) 2,9931(0,0213) α 0,5528(0,0040) 0,5566(0,0048) 0,5629(0,0057) 500 σ 0,5443(0,0028) 0,5474(0,0032) 0,5535(0,0042) β0 2,0015(0,0016) 1,9999(0,0018) 1,9999(0,0024) β1 2,9966(0,0026) 2,9966(0,0032) 2,9943(0,0050) 3.4.3 Probabilidade de cobertura

Para verifica¸cão das probabilidades de cobertura foram constru´ıdos intervalos de confian¸ca para os parâmetros. O estudo de simula¸cão é realizado para n = 100, 200 e 300 com α = 1, 2, σ = 1, 5, β0 = 2, β1 = 3 e porcentagens de censura 0%, 10% e 30%.

Foram determinados 3.000 intervalos de confian¸ca, com um n´ıvel de 95%, baseados nas estimativas de máxima verossimilhan¸ca obtidas para cada configura¸cão de n e porcentagens de observa¸cões censuradas. Ainda, calculou-se quantos intervalos continham os verdadeiros valores dos parâmetros para cada configura¸cão especificada. As porcentagens de cobertura são dadas por: ((3.000 - no _{de intervalos que não contem o verdadeiro valor}

do parˆametro)/3.000)×100%.

Para cada configura¸c˜ao apresentadas na Tabela 3.2, conclui-se que:

• Se consideradas observa¸cões não censuradas, as probabilidades de coberturas tendem a aumentar à medida que o tamanho amostral aumenta, como esperado;

• Se a porcentagem de observa¸c˜oes censuradas mudam, observa-se que h´a um pequeno efeito sobre as probabilidades de cobertura.

Tabela 3.2 - Porcentagens de cobertura dos EMVs dos parâmetros do modelo de regressão LOLLW n Parâmetro 0% 10% 30% α 95,87% 95,47% 94,13% 100 σ 94,83% 94,43% 93,17% β0 95,53% 95,20% 95,50% β1 93,77% 94,50% 93,67% α 95,63% 96,83% 96,70% 200 σ 95,57% 97,20% 96,20% β0 95,50% 95,77% 95,73% β1 95,43% 94,97% 95,20% α 95,53% 97,77% 97,27% 300 σ 95,43% 97,47% 96,90% β0 95,23% 95,90% 96,03% β1 95,33% 95,83% 95,20%

Dans le document CONVENTION L ENTENTE ASSURANCES K42 MODULO AUTO VIP PLUS CONTRAT N (Page 3-6)