• Aucun résultat trouvé

La narration dans le roman comme un mode d’énonciation

Quando a dimens˜ao do conjunto de efeitos aleat´orios do modelo baseado na verosimilhan¸ca conjunta ´e grande, os m´etodos computacionais de Monte Carlo podem requerer um enorme es- for¸co computacional. Tsiatis e Davidian (2001,2004) prop˜oem obviar estas dificuldades usando um m´etodo score condicional, o qual n˜ao faz suposi¸c˜oes distribucionais para os efeitos aleat´orios, tratando-os como parˆametros perturbadores. Esta abordagem conduz a um conjunto de equa¸c˜oes de estima¸c˜ao semelhantes `as equa¸c˜oes de estima¸c˜ao generalizadas (“Generalized estimating equa- tions” - GEE,Liang e Zeger (1986)). Song et al.(2002a) consideraram que os efeitos aleat´orios seguiam uma distribui¸c˜ao pertencente a uma fam´ılia de densidades suaves. A inferˆencia baseou- se na verosimilhan¸ca conjunta recorrendo ao algoritmo EM, mas a computa¸c˜ao revelou-se ser consideravelmente mais intensiva que a do m´etodo score. Uma alternativa determin´ıstica, que fornece vantagens consider´aveis, s˜ao as aproxima¸c˜oes de Laplace (Wu et al.,2010). Rizopoulos et al. (2009) prop˜oe a utiliza¸c˜ao da forma exponencial completa da aproxima¸c˜ao de Laplace no passo E do algoritmo EM. Contudo, estas aproxima¸c˜oes de Laplace n˜ao permitem controlar a magnitude do erro, ao contr´ario da quadratura Gaussiana ou das t´ecnicas de integra¸c˜ao de Monte Carlo.

Uma alternativa bayesiana aos m´etodos de simula¸c˜ao MCMC ´e o m´etodo determin´ıstico Integrated Nested Laplace Approximation (INLA) (Rue et al., 2009). ´E um instrumento que permite executar facilmente inferˆencia bayesiana aproximada em modelos Gaussianos latentes, que s˜ao um subconjunto de todos os modelos aditivos Bayesianos. Os autores mostraram que esta nova abordagem ´e bastante r´apida, principalmente devido ao facto de fazer uso de algoritmos para matrizes esparsas, as quais s˜ao inerentes `a classe de modelos gaussianos latentes. Al´em disso, mostram que a nova abordagem supera, em algumas situa¸c˜oes, os m´etodos MCMC em termos de precis˜ao e esfor¸co computacional.

Os procedimentos necess´arios para executar uma an´alise via INLA s˜ao executados de forma eficiente na biblioteca GMRFLib, de c´odigo aberto escrito em (ANSI)C e Fortran. Est´a dis- pon´ıvel um pacote em R, designado R-INLA, e que funciona como uma interface ao programa INLA. O seu uso ´e semelhante a todas as outras fun¸c˜oes dispon´ıveis no R, sendo disponibilizado gratuitamente em http://www.r-inla.org/home.

O pacote JM (Joint Models), tamb´em dispon´ıvel no R (Rizopoulos,2010), oferece aos uti- lizadores uma grande variedade de modelos de sobrevivˆencia com fun¸c˜ao de risco de base pa- ram´etrica ou semi-param´etrica, e uma vasta gama de modelos de efeitos mistos. A vers˜ao actual permite modelar a dependˆencia entre os processos, utilizando quer o valor actual subjacente do processo longitudinal, quer a taxa de crescimento dYi∗(t)/dt, ou ambos. No caso de modelos de sobrevivˆencia param´etricos ´e utilizada a estima¸c˜ao via m´axima verosimilhan¸ca. J´a no caso de modelos semi-param´etricos ´e utilizado o algoritmo EM. As probabilidades de sobrevivˆencia preditivas s˜ao obtidas atrav´es de um procedimento de Monte Carlo. N˜ao permite a inclus˜ao de modelos com efeitos aleat´orios espaciais estruturados. O software est´a em cont´ınua atua-

liza¸c˜ao e para mais pormenores poder´a ser consultada a p´agina http://rwiki.sciviews.org/ doku.php?id=packages:cran:jm. Ainda do mesmo autor (Rizopoulos, 2012a), foi publicado recentemente o pacote JMbayes – http://CRAN.R-project.org/package=JMbayes. Trata-se de uma ferramenta que, como o nome indica, possibilita a abordagem bayesiana dos modelos conjuntos, recorrendo para tal, a trˆes programas externos ao R: WinBUGS1, OpenBUGS (Lunn et al.,2009) e JAGS (Plummer,2003), consoante o interesse do utilizador. Este permite, entre outras coisas, modelar um risco de base com forma Weibull ou definido atrav´es de B-Splines e possibilita a realiza¸c˜ao de predi¸c˜oes para os resultados longitudinal e de sobrevivˆencia.

Tamb´em dispon´ıvel no R est´a uma colabora¸c˜ao que resulta do trabalho de v´arios auto- res (Philipson et al.,2012) – o pacote JoineR –http://cran.r-project.org/web/packages/ joineR/index.html. Este software permite a utiliza¸c˜ao de modelos de efeitos aleat´orios parti- lhados. A liga¸c˜ao entre os dois processos pode ser feita atrav´es de ordenadas na origem aleat´orias, Wi(t) = b0i; atrav´es de ordenada e declive aleat´orios, W2(t) = b0i+b1it; ou atrav´es de uma forma

quadr´atica, Wi(t) = b0i+ b1it + b2it2 . Actualmente, o software n˜ao permite a especifica¸c˜ao pa-

ram´etrica de h0(t) e os erros-padr˜ao s˜ao obtido atrav´es de t´ecnicas de bootstrap.

1

O WinBUGS, a par do OpenBUGS e do JAGS s˜ao pe¸cas de software para an´alise bayesiana de modelos estat´ısticos utilizando m´etodos MCMC. Apesar de existir bastante software dispon´ıvel para ajustar tanto modelos marginais como modelos conjuntos para dados longitudinais e de sobrevivˆencia, estas s˜ao ferramentas computacionais mais especializadas para tratar estes dados do ponto de vista bayesiano.

Parte II

Modelos conjuntos –

1

Introdu¸c˜ao

Os cap´ıtulos seguintes ser˜ao dedicados ao desenvolvimento e aplica¸c˜ao de modelos conjuntos a dados reais de VIH/SIDA, descritos no cap´ıtulo II-2. Fundamentalmente, os objectivos da segunda parte deste trabalho ser˜ao: (i) desenvolver modelos conjuntos para dados longitudinais e de sobrevivˆencia, ampliando alguns dos modelos presentes na literatura especializada; (ii) aplicar a metodologia conjunta proposta, aos dados no contexto de pacientes com VIH/SIDA.

Por conveniˆencia a aplica¸c˜ao ser´a dividida em quatro tipos/grupos de modelos conjuntos (vide resumo na tabela 1.1) divididos por trˆes cap´ıtulos. No cap´ıtuloII-3 (Modelos conjuntos com fragilidade espacial - doravante denotado por modelos A) faremos uma extens˜ao do mo- delo utilizado por Guo e Carlin (2004), acrescentando uma fragilidade espacial no modelo de sobrevivˆencia. Este efeito aleat´orio ser´a partilhado pelos indiv´ıduos de uma mesma regi˜ao, uma vez que a inclus˜ao de informa¸c˜ao espacial poder´a melhorar as estimativas dos parˆametros do modelo. Nos segundo e terceiro grupos de modelos (cap´ıtuloII-4,Modelos conjuntos com sobre- viventes de longa dura¸c˜ao) - denotados doravante por modelos B, se existir partilha de efeitos aleat´orios entre a componente longitudinal e a de sobrevivˆencia, e por modelos C, se a liga¸c˜ao entre submodelos for `a custa do valor actual da medida longitudinal. Nestes dois cen´arios, a modela¸c˜ao pressup˜oe a existˆencia de uma frac¸c˜ao de sobreviventes de longa dura¸c˜ao. A justi- fica¸c˜ao para tal modelo prende-se com o facto de serem cada vez mais frequentes os estudos que indicam que a esperan¸ca de vida destes pacientes ´e praticamente igual `a dos demais pacientes, havendo, por isso, a tendˆencia de a SIDA se tornar numa doen¸ca cr´onica e n˜ao numa senten¸ca de morte. Ora, ainda que n˜ao estejam medicamente curados, estes indiv´ıduos poder˜ao ser conside- rados sobreviventes de longa dura¸c˜ao, reflectindo, de certa forma, a natureza cr´onica da doen¸ca. Finalmente, analisaremos o caso em que o modelo linear de efeitos mistos ´e preterido a favor de um modelo n˜ao param´etrico, substitu´ındo-se o efeito linear do tempo no marcador longitudinal (contagens de CD4), por um efeito n˜ao linear, modelado atrav´es de B-splines com penaliza¸c˜ao e mantendo-se o modelo de sobrevivˆencia exponencial (cap´ıtulo II-5,Modelos conjuntos B-Spline com penaliza¸c˜ao - doravante denotado por modelos D).

Modelo Longitudinal Sobrevivˆencia Liga¸c˜ao

A linear de exponencial com partilha de

efeitos mistos fragilidade espacial efeitos aleat´orios

B linear de Weibull e exponencial partilha de

efeitos mistos com frac¸c˜ao de cura efeitos aleat´orios

e fragilidade espacial

C linear de Weibull e exponencial partilha do valor de CD4

efeitos mistos com frac¸c˜ao de cura no instante de evento

e fragilidade espacial

D n˜ao linear com exponencial partilha do valor de CD4

B-splines penalizados no instante de evento

Tabela 1.1: Resumo dos grupos de modelos conjuntos.

Em cada um dos cap´ıtulosII-3,II-4eII-5, ser˜ao desenvolvidos os quatro grupos de modelos conjuntos, precedidos de uma an´alise explorat´oria dos dados de VIH/SIDA (cap´ıtuloII-2), ponto de partida da aplica¸c˜ao daqueles trˆes cap´ıtulos. No cap´ıtulo II-5.2.7ser´a feita uma s´ıntese sobre a performance dos v´arios modelos, comparando-os entre si.

2

Dados de VIH-SIDA

O Programa Nacional Brasileiro de luta contra a SIDA tem sido, reconhecidamente, um sucesso no controlo da epidemia. Gerou trˆes grandes bases de dados electr´onicas (Fonseca et al.,

2010): SINAN-AIDS (Sistema Nacional de Agravos de Notifica¸c˜ao de Casos de AIDS), SISCEL (Sistema de Controlo de Exames Laboratoriais) e SICLOM (Sistema de Controle Log´ıstico de Medicamentos). O conjunto de dados VIH-SIDA a analisar neste trabalho foi obtido atrav´es do cruzamento das bases nacionais referidas acima e da base SIM (Sistema de Informa¸c˜oes sobre Mortalidade) atrav´es da metodologia de relacionamento probabil´ıstico Record Linkage (Fonseca et al.,2010).

2.1

Contextualiza¸c˜ao biol´ogica

Nos ´ultimos anos tem havido um aumento de estudos m´edicos onde s˜ao recolhidos em si- multˆaneo marcadores biol´ogicos longitudinais e informa¸c˜ao sobre a sobrevivˆencia dos pacientes. Sendo importantes indicadores de progress˜ao da doen¸ca, os biomarcadores s˜ao utilizados como preditores da sobrevivˆencia ou de algum outro evento cl´ınico de interesse. Estes, s˜ao medidos repetidamente ao longo de um certo per´ıodo de tempo e est˜ao sujeitos a erros de medida e ele- vada variabilidade dentro de cada paciente devido, sobretudo, `as flutua¸c˜oes biol´ogicas. O tempo entre medi¸c˜oes do biomarcador tamb´em pode variar bastante, n˜ao s´o no mesmo paciente, como entre os pacientes.

O V´ırus da Imunodeficiˆencia Humana (VIH) ataca directamente o sistema imunit´ario le- vando, a que uma boa parte das pessoas infectadas desenvolva a S´ındrome da Imunodeficiˆencia Adquirida (SIDA). No caso dos pacientes com VIH/SIDA, o biomarcador imunol´ogico de maior interesse cl´ınico, e que normalmente ´e medido durante o per´ıodo em que s˜ao seguidos, ´e a con- tagem, por mm3 de sangue, de um subtipo das c´elulas linfocit´arias T, as c´elulas T-CD4+ (CD4 por simplicidade). Os linf´ocitos s˜ao um tipo de gl´obulo branco fabricado na medula ´ossea e que sofre matura¸c˜ao no timo (da´ı a designa¸c˜ao T ou tim´ocito) e alguns, durante o processo

de matura¸c˜ao, passar˜ao a ter presente na sua superf´ıcie uma mol´ecula de CD4. Estas c´elulas s˜ao um elemento fundamental do sistema imunit´ario, porque informam outras c´elulas sobre a necessidade de combater o v´ırus. Um outro biomarcador longitudinal ´e a carga viral (marcador virol´ogico), que mede a quantidade de v´ırus presente no plasma sangu´ıneo. Existem actualmente v´arias t´ecnicas para medir a carga viral. Salientamos em primeiro lugar a PCR (“polymerase chain reaction”) que usa uma enzima para multiplicar o VIH na amostra de sangue seguida duma reac¸c˜ao qu´ımica que marca o v´ırus. Estes s˜ao ent˜ao medidos e usados para calcular a quantidade de v´ırus. Existe ainda a t´ecnica bDNA (“branched DNA”) que combina um material que emite luz com a amostra. Este material liga-se `as part´ıculas do VIH sendo a quantidade de luz medida e convertida em contagem de v´ırus. A primeira tem vindo a sobrepor-se `a segunda e ´e aquela que actualmente ´e utilizada, por exemplo, no Brasil.

Nos estudos de sobrevivˆencia de pacientes com VIH/SIDA, tem-se demonstrado que a con- tagem longitudinal do n´umero de c´elulas CD4 ´e um bom preditor do evento cl´ınico, neste caso a morte (Tsiatis et al. (1995);Lavalley e De Gruttola(1996); DeGruttola e Tu(1994) e DeGrut- tola et al. (1993)). A quest˜ao de saber at´e onde as contagens de CD4 s˜ao capazes de prever o evento cl´ınico, actuando como marcadores substitutos, ´e estudada modelando conjuntamente o processo do biomarcador longitudinal e do tempo de sobrevivˆencia. Elevadas contagens de CD4 indicam um sistema imunit´ario forte e que est´a mais preparado para resistir a infec¸c˜oes. N´ıveis baixos daquelas contagens s˜ao indicadores de um elevado risco de contrair uma infec¸c˜ao opor- tunista (IO). As mais comuns s˜ao: Candid´ıase - infec¸c˜ao f´ungica da boca, garganta ou vagina; Citomegalovirus (CMV) - infec¸c˜ao viral que causa doen¸cas nos olhos e que pode levar `a cegueira; V´ırus Herpes simplex (MHS) - pode causar herpes oral (aftas) ou herpes genital; Micobacterium avium complex (MAC) - infec¸c˜ao bacteriana que causa febres recorrentes, mal-estar geral, pro- blemas digestivos e perda de peso acentuada; Pneumonia a pneumocystis (PPC) - infec¸c˜ao por um fungo que causa uma pneumonia fatal; Toxoplasmose (Toxo) - infec¸c˜ao por um protozo´ario no c´erebro; Tuberculose (TB) - infec¸c˜ao bacteriana que ataca os pulm˜oes e que pode causar meningite. Quanto `a carga viral, ´e desej´avel que esta se mantenha em n´ıveis baixos ou mesmo indetect´aveis. Quando um paciente inicia um tratamento com os medicamentos anti-retrovirais a carga viral pode decair drasticamente para n´ıveis n˜ao detect´aveis. Ao contr´ario, as contagens de CD4 podem demorar mais tempo at´e atingirem n´ıveis que permitam ao sistema imunit´ario reagir a uma qualquer infec¸c˜ao.

Muitos ensaios cl´ınicos tˆem como objectivo estudar o tempo at´e os pacientes desenvolve- rem algum tipo de IO. Nestes ensaios os marcadores imunol´ogicos e virol´ogicos s˜ao utilizados como vari´aveis preditoras dependentes do tempo. Usualmente, em conjunto com as medidas longitudinais dos biomarcadores, ´e tamb´em conhecida a informa¸c˜ao relativa ao tempo de sobre- vivˆencia dos pacientes. Dependendo do objectivo em estudo, utiliza-se, geralmente, um modelo de efeitos mistos para modelar os biomarcadores longitudinais e um modelo param´etrico ou semi-param´etrico para a an´alise de sobrevivˆencia.

Documents relatifs