3. The Enablers of 5G
3.3. Network Slicing: a key feature of 5G bringing new possibilities
Como já referimos anteriormente, no caso do nosso estudo, foram analisadas as situações inter-observadores e intra-observadores. Os resultados analisados são referentes ao “score” total da aplicação do IARCUA e ao “score” das diversas sub-escalas que o constituem. Neste sentido, analisámos quatro grupos de dados referidos neste trabalho como A1 (observador A no primeiro dia), B1 (observador B no primeiro dia), A2 (observador A no segundo dia) e B2 (observador B no segundo dia).
Giacino et al. (2004), no estudo da fiabilidade da CRS-R, optou por agrupar os itens quantitativos de avaliação de cada uma das sub-escalas em categorias qualitativas (sub- escalas dicotomizadas). O objectivo desta transformação é no sentido de poder aplicar o teste de Kappa de Cohen para medir a fiabilidade da escala. Este teste só pode ser aplicado a variáveis ordinais e não pode haver “classes nulas”, ou seja, classes com uma frequência absoluta nula. Este procedimento é, na nossa opinião, limitado porque a transformação de uma variável quantitativa para uma qualitativa leva à perda de informação clínica importante. Neste sentido aplicámos testes de avaliação da fiabilidade e da correlação para as escalas não dicotomizadas, através dos testes de “Intraclass Correlation” (ICC) e do teste de “Spearman Rank”, respectivamente. No entanto, visto que tínhamos como objectivo a comparação dos nossos resultados com os resultados provenientes do estudo de Giacino et al. (2004) calculámos adicionalmente o teste do “Kappa de Cohen” e o acordo entre observadores.
Todas as análises estatísticas foram realizadas usando o programa Statistical Package for
Social Science (SPSS) 17.0 e o nível de significância usado foi de 0,05. As orientações
4.3.4.1 Sub-escalas Não Dicotomizadas
Para a análise da fiabilidade das sub-escalas não dicotomizadas do IARCUA aplicámos o teste ICC dado estarmos a tratar variáveis quantitativas. Este teste foi utilizado para examinar a concordância absoluta (“Absolute Agreement”) nos “scores” totais e nas sub- escalas não dicotómicas a análise da fiabilidade inter-observadores e intra-observadores (teste-reteste). Aplicámos um modelo de dois factores aleatórios (“Two-way Random Model”), pois os avaliadores e classificações eram aleatórios. No nosso estudo considerou- se uma amostra aleatória de dois avaliadores seleccionados de uma população de avaliadores de maior dimensão e cada um dos dois avaliou 20 pessoas com alterações da consciência (Shrout & Fleiss, 1979). Também foi calculado o intervalo de confiança de 95% para os valores de ICC.
Também se aplicou o método de análise de Bland & Altman (1986) para verificar se existia alguma diferença entre pares ao longo do tempo (dia 1 com o dia 2) e entre observadores (observador 1 com o observador 2). O método de análise de Bland & Altman (1986) foi usado para avaliar a média e o desvio padrão das diferenças entre pares (Mdif e DPdif, respectivamente) e os limites de 95% de concordância (Mdif±2DPdif). O valor da mediana das diferenças entre pares (Meddif) também é apresentado, como uma medida de estatística descritiva mais robusto do que a média das diferenças. Nos limites de 95% de concordância, se o valor 0 pertencer ao intervalo significa que não há diferenças estatísticas entre os pares, senão pertencer então existem diferenças estatísticas entre os pares (Bland & Altman, 1986).
Finalmente, ainda para as sub-escalas não dicotomizadas, foi aplicado um teste de Sinais (“Sign test”) com a finalidade de testar se existiam diferenças de medianas entre os dois momentos de avaliação. A escolha do teste deve-se ao facto de quase todas as diferenças entre pares mostrarem propriedades de não-normalidade e de não-simetria. Se esta diferença for estatisticamente significativa, o teste de ICC irá ser calculado através consistência (“Consistency”) das avaliações, em vez da concordância absoluta (“Absolute Agreement”). A diferença entre as duas opções está na forma como a variabilidade sistemática dos avaliadores ou das classificações dos sujeitos é tratada. Na opção “consistency” a variabilidade entre as pontuações é considerada irrelevante enquanto na opção “absolute agreement” a variabilidade entre as pontuações é considerada relevante. Ou seja, no primeiro caso avalia tendências ou valores relativos das pontuações dadas, enquanto no segundo avalia os valores absolutos dados pelos avaliadores (McGraw & Wong, 1996).
Utilizámos igualmente medidas de consistência para verificar se os “scores” dos avaliadores são altamente correlacionados.
Finalmente foi calculada a correlação entre os totais e as diversas sub-escalas não dicotomizadas do IARCUA para os 4 momentos de avaliação através do teste de correlação de Spearman Rank. Neste sentido, foi calculado para avaliar a fiabilidade inter-observadores entre o observador A e o observador B no primeiro e no segundo dias de avaliação (A1-B1 e A2-B2), para avaliar a fiabilidade do teste-reteste (intra-observadores) para o observador A e observador B em dois dias distintos (A1-A2 e B1-B2), e ainda, para avaliar a correlação cruzada entre o observador A no segundo dia e o observador B no primeiro dia (A2-B1) e entre o observador A no primeiro dia e o observador B no segundo dia (A1-B2). Nesta avaliação, as comparações A1-B1 e A2-B2 deram-nos informação acerca do erro por parte dos examinadores, enquanto que as comparações A1-A2 e B1-B2 ilustraram as flutuações no estado clínico das pessoas avaliadas. As correlações A2-B1 e A1-B2 representam uma influência combinada da variabilidade do examinador e a flutuação do estado clínico das pessoas avaliadas.
A média e o desvio padrão das correlações dadas pelos avaliadores (A1, A2, B1, B2) foram calculados para comparar com o resultado apresentado por Giacino et al. (2004) de um só momento de avaliação.
4.3.4.2 Sub-escalas Dicotomizadas
Antes de iniciarmos a aplicação dos testes estatísticos sugeridos por Giacino, Kalmar & White (2004), realizámos uma análise exploratória dos dados para visualizarmos a distribuição dos scores de cada uma das sub-escalas do IARCUA. Neste sentido, construímos diversos histogramas, o que nos permitiu identificar as sub-escalas com scores nulos ou pouco representados (ver Apêndice 18).
Nesta análise verificámos que, tal como no estudo de Giacino, Kalmar & White (2004), não era possível testar o “Kappa de Cohen” em todas as sub-escalas, pois a sub-escala
movimento corporal apresentava “scores” parciais nulos. Segundo Giacino, Kalmar & White
(2004, p.2023) este problema é tipicamente causado por uma frequência baixa dos “scores” nos níveis mais elevados e mais baixos das sub-escalas. Assim, optámos por agrupar as variáveis representadas pelas sub-escalas em escalas dicotómicas sugeridas por Giacino, Kalmar & White (2004), sendo os critérios de agrupamento os indicadores de Estado Vegetativo ou Estado de Consciência Mínima (ver Tabela 11). A sub-escala consciência foi eliminada desta análise porque, segundo Giacino, Kalmar & White (2004) os seus “scores” não contribuem para a definição de um diagnóstico diferencial.
Para a análise da fiabilidade das sub-escalas dicotómicas do IARCUA, e dada a natureza das variáveis, o teste do Kappa de Cohen foi utilizado de forma a testar a sua concordância nas seguintes situações: inter-observadores (A1-B1 e A2-B2) e intra-observadores (A1-A2 e
B1-B2). Optámos pela aplicação deste teste estatístico dado estarmos a analisar variáveis ordinais categorizadas.
Tabela 15. Critérios para Estado Vegetativo e Estado de Consciência Mínima.
Adaptado de Giacino et al. (2004).
Sub-escala Estado Vegetativo Estado de Consciência Mínima Auditory ≤ 2 3-4 e ou Visual ≤ 1 2-5 e ou Motor ≤ 2 3-6 e ou Oromotor/verbal ≤ 2 3 e ou Communication 0 1-3