Le pathos - Les types des arguments - La typologie des arguments

Chapitre 2 L’argumentation dans le roman : fondements et finalités . 43

2. La typologie des arguments

2.2 Les types des arguments

2.2.2 Le pathos

O termo P-spline foi pela primeira vez introduzido por Eilers e Marx(1992), para designar as fun¸cões B-spline com penaliza¸cão num contexto de ajuste de curvas. Neste contexto, a fun¸cão não linear m(.) era aproximada, supondo que o efeito da covariável X podia ser descrito por uma fun¸cão spline, escrita em termos de uma combina¸cão linear de fun¸cões de base B-spline, com nós igualmente espa¸cados, penalizando as diferen¸cas entre coeficientes de regressão consecutivos. Tal facto conduz a uma contraçcão dos coeficientes bq, q = 1, . . . , Q, em direçcão a zero ou à

penaliza¸c˜ao de diferen¸cas muito acentuadas entre parˆametros consecutivos. Em (Eilers e Marx,

1996) é feito o desenvolvimento mais aprofundado desta metodologia. Ruppert et al. (2003) desenvolvem uma abordagem alternativa baseada em fun¸cões potência truncadas, com nós não igualmente espa¸cados e uma penaliza¸cão das cristas. Devido ao aumento da popularidade de ambas as abordagens, o termo P-spline pode tornar-se confuso numa abordagem inicial do problema, pois não evidencia qual a base de fun¸cões e o tipo de penaliza¸cão, por isso Eilers e Marx(2010) sugerem o uso de PB-spline e PT-spline, para as fun¸cões B-spline com penaliza¸cão e para as TPF com penaliza¸cão, respectivamente. Para uma discussão aprofundada relativamente `

as diferen¸cas e semelhan¸cas entre ambos os métodos pode consultar-se Eilers e Marx(2010). A ideia por trás desta abordagem é conceptualmente simples. Já vimos que a fun¸cão desco- nhecida, m(x), pode ser aproximada através de uma combina¸cão linear de fun¸cões de base com suporte local, B-splines. A utiliza¸cão de uma base de fun¸cões de dimensão reduzida revela-se, frequentemente, pouco flex´ıvel, obrigando a uma escolha muito cuidada dos nós. Esta dificul- dade levou a que se considerassem bases com uma dimensão elevada, assegurando que o número de fun¸cões seja o bastante para permitir flexibilidade suficiente na forma da fun¸cão estimada. Contudo, a dimensão elevada da base conduz-nos a problemas de sobreajustamento. Para se evitar tal facto, os coeficientes das fun¸cões que constituem a base são penalizados, por forma a obrigar a que a fun¸cão estimada seja mais suave.

Seja B a matriz das Q fun¸c˜oes de base B-spline avaliadas nos pontos xi, i = 1, . . . , N , tal

como visto em (II-5.8). Do ponto de vista frequencista, a fun¸cão objectivo para o ajuste através de fun¸cões PB-spline é dada pelo critério de m´ınimos quadrados penalizados

min

b ky − Bbk 2₊ 1

τ2k∆

d_bk2_, _(5.10)

onde ∆d de dimensão (Q − d) × Q é a matriz das diferen¸cas de ordem d e τ2 é o parâmetro suavizador que controla a quantidade de penaliza¸cão. Com efeito, esta forma penaliza desvios da curva ajustada relativamente a um polinómio de grau d − 1 (Eilers e Marx,1996), uma vez que a derivada de ordem d das fun¸cões B-spline depende, essencialmente, das diferen¸cas de ordem d.

Brezger e Lang(2006) e socorre-se de passeios aleatórios, de 1aou de 2a, ordem como substitutos naturais das penaliza¸cões relativas às diferen¸cas entre coeficientes bq adjacentes e que assegu-

ram a suavidade da fun¸cão. O procedimento é baseado numa distribui¸cão a priori gaussiana homoscedástica para as diferen¸cas de ordem d, ∆db, dos coeficientes, b, das fun¸cões B-spline, isto é:

∆db ∼ N (0, τ2IQ−d), (5.11)

resultando que,

bj = bj−1+ uj, j = 2, . . . , Q, (5.12)

no caso de um passeio aleat´orio de ordem 1, e que

bj = 2bj−1− bj−2+ uj, j = 3, . . . , Q, (5.13)

no caso de um passeio aleat´orio de ordem 2. Em ambos os casos uj ∼ N (0, τ2). S˜ao ainda

supostas distribui¸c˜oes a priori difusas para π(b1) ∝ constante no caso do passeio aleat´orio de

ordem 1 e π(b1), π(b2) ∝ constante para um passeio aleat´orio de ordem 2. Alternativamente,

(II-5.12) e (II-5.13) podem ser escritas como

bj|bj−1∼ N (bj−1, τ2) e bj|bj−1, bj−2 ∼ N (2bj−1− bj−2, τ2), (5.14)

respectivamente. Valores elevados da variância τ2 correspondem a curvas estimadas mais “rugo- sas”, enquanto que valores baixos correspondem a curvas estimadas mais suaves. A distribui¸cão para este parâmetro é uma gama inversa, π(τ2_{) ∼ GI(α, β). Uma escolha bastante comum}

é α = β = 0.001, o que corresponde a uma distribui¸cão a priori não informativa, vaga mas própria.

A suposi¸cão de um parâmetro global de variância, τ2, poderá ser inapropriada. Por exemplo, no caso de fun¸cões muito oscilantes numa parte e pouco oscilantes noutra, pode tornar-se necessário introduzir uma penaliza¸cão local. Em tais situa¸cões poderá ser utilizada uma distribui¸cão a priori alternativa, nomeadamente aquela que considera maiores penaliza¸cões em áreas de pequena varia¸cão e menores penaliza¸cões em zonas de maior curvatura ou de descontinuidades, o que significa que esta distribui¸cão deverá ter uma moda em 0, por um lado, mas cauda pesada, por outro. Uma candidata promissora é a distribui¸cão Norma-Exponencial-Gamma (Griffin e Brown, 2007) que combina as propriedades desejadas, com conveniência computacional, num modelo bayesiano hierárquico.

A distribui¸cão conjunta dos coeficientes b é uma distribui¸cão gaussiana multivariada (imprópria), cuja distribui¸cão a priori conjunta é

π b|τ2 ∝ exp − 1 2τ2b > Pb , (5.15)

5.2 Aplica¸c˜ao

apropriada, dada por P = D>D, sendo que D é a matriz (Q − d) × Q das diferen¸cas de ordem d. Este facto explica a equivalência entre a aproxima¸cão bayesiana e aquela obtida através da maximiza¸cão da verosimilhan¸ca penalizada (Brezger e Lang,2008).

No caso de um passeio aleat´orio de ordem 1, por exemplo, a matriz P ´e dada por

D>D =          −1 1 −1 . ._. . ._. . ._. 1 −1 1          ×          −1 1 −1 1 . ._. . ._. . ._. −1 1 −1 1          =          1 −1 −1 2 −1 . ._. . ._. . ._. −1 2 −1 −1 1          = P (5.16)

ou, no caso de um passeio aleat´orio de ordem 2, a matriz P ´e dada por

D>D =               1 −2 1 1 −2 1 . ._. . ._. . ._. 1 −2 1 1 −2 1               ×          1 −2 1 1 −2 1 . ._. . ._. . ._. 1 −2 1 1 −2 1          =            1 −2 1 1 −4 6 −4 1 . ._. . ._. . ._. 1 −4 6 −4 1 1 −4 5 −2 1 −2 1            = P. (5.17)

A matriz P não é de caracter´ıstica completa. No caso de diferen¸cas de ordem d = 2, a caracter´ıstica é Q − 2. Por isso, (II-5.15) tem a forma de uma distribui¸cão normal singular, sendo, portanto, imprópria. Contudo, a distribui¸cão a posteriori é própria (Brezger e Lang,

2008).

5.2 Aplica¸c˜ao

Nesta seçcão iremos apresentar um modelo conjunto onde o biomarcador longitudinal CD4 será modelado usando uma base de fun¸cões B-spline cúbicas com penaliza¸cão. Devido às dificul- dades encontradas no processo de ajustamento do modelo, nomeadamente no que concerne ao tempo computacional, reduzimos o número de indiv´ıduos. Dos 4653 iniciais, descritos na seçcão

II-2, passámos para 500, tendo o cuidado de manter as mesmas propor¸cões que a´ı foram referi- das. Além disso, não foi inclu´ıda qualquer fragilidade espacial ou fraçcão de cura no submodelo de sobrevivência.

5.2.1 Modelo longitudinal

Consideremos que o verdadeiro valor de √CD4 (biomarcador longitudinal) do i-´esimo indiv´ıduo no instante t, y_i∗(t), ´e bem aproximado pelo modelo (II-5.3) com r = 1, ao qual adicio-

namos uma ordenada na origem comum, β10, e uma individual, bi0, ou seja,

y_i∗(t) = m1i(X1i) + zi>β1+ (β10+ bi0), (5.18)

onde m1i(.) é a fun¸cão que vai ser estimada através de fun¸cões B-spline cúbicas com penaliza¸cão

de ordem 2, utilizando passeios aleatórios de 2a ordem que penalizam as diferen¸cas entre os coeficientes das fun¸cões B-Spline, X1i representa uma covariável longitudinal, que neste caso

será substitu´ıda pelo tempo, t, zié um vector de s covariáveis observadas e β1>= (β11, . . . , β1s)

é o respectivo vector de coeficientes de regressão. Por simplicidade, vamos omitir o ´ındice 1 da nota¸cão da fun¸cão m, porque vamos utilizar uma única fun¸cão.

A fun¸cão mi(t) pode ser dividida em duas partes. Uma parte fixa, respeitante à popula¸cão,

e uma parte aleat´oria, respeitante a cada indiv´ıduo. Assim,

mi(t; β2, bi, p) = Q

q=1

(β2q+ biq)Bq(t; p), (5.19)

onde Q representa o número de fun¸cões B-spline, β₂>= (β21, β22, . . . , β2Q) é o vector dos efeitos

da popula¸cão e b>_i = (bi1, bi2, . . . , biQ) é o vector dos efeitos individuais. O parâmetro p pode

agora ser exclu´ıdo da nota¸cão, uma vez que nos cingiremos ao caso p = 3, isto é, a B-splines cúbicas. Em suma, o valor esperado do marcador longitudinal no instante t dados os efeitos aleatórios e as covariáveis de base, assume a forma

E [yi(t|bi, bi0)] = mi(t; β2, bi) + z>i β1+ (β10+ bi0) = Q X q=1 (β2q+ biq)Bq(t) + zi>β1+ (β10+ bi0). (5.20)

O número de nós que utilizaremos para definir as fun¸cões B-spline será fixo. Testaremos vários cenários, sendo que o número seleccionado será baseado no valor do DIC. Em particular, fixare- mos nós a cada 2 meses, o que fará um total de 30 nós (relembre-se que a nossa base de dados abrange um per´ıodo de 5 anos), a cada 3 meses (resultando num total de 20 nós), a cada 4 meses (resultando num total de 15 nós) e a cada 6 meses (perfazendo um total de 10 nós).

Continuaremos a utilizar aqui as mesmas covariáveis de base já anteriormente utilizadas nos cap´ıtulosII-3eII-4, nomeadamente sexo, idade.int e IOPrev. Por fim, o modelo longitudinal PB-spline (II-5.20) assumirá então a forma

E [yi(t|bi, bi0)] = Q

q=1

(β2q+ biq)Bq(t) + (β10+ bi0)+

5.2 Aplica¸c˜ao

5.2.2 Modelo de sobrevivˆencia

A forma para ligar o modelo de sobrevivência ao modelo longitudinal, nestes modelos, inici- almente denotados por modelos D (vide tabela1.1), não utilizará a partilha dos efeitos aleatórios entre os submodelos, pois a utiliza¸cão de splines num modelo longitudinal impede uma inter- preta¸cão prática desses mesmos efeitos aleatórios (Rizopoulos e Ghosh,2011). Por isso, iremos utilizar aqui a parametriza¸cão mais tradicional dos modelos conjuntos. O valor da trajectória do marcador longitudinal CD4 no instante t, y∗_i(t), será introduzido no modelo de riscos relativos como uma covariável dependente do tempo. Portanto, a fun¸cão de risco (relativo) dada a medida longitudinal é expressa como

hi(t|y∗i(t)) = h0(t) exp{z>i β3+ γyi∗(t)}, (5.22)

onde z>_i é um vector de covariáveis de base, que neste caso vai coincidir com as utilizadas no modelo longitudinal, β3 é o respectivo vector de parâmetros que liga as covariáveis de base ao

risco de falha e γ ´e um parˆametro que quantifica directamente o efeito do processo longitudinal no risco de evento.

Dans le document etude du discours argumentatif dans le sermon sur la chute de rome de jérome ferrari (Page 59-63)