CAPUT I. 26 redditur. Alioqui referre gratiam, est boneficii
3» DE CLEMENTIA 40 Fallit enim vitium specie virtutis et ombra,
87 D E OLE: IMENTIA 88
A partir do modelo de referência desenvolvido para a segmentação das imagens tér- micas capturadas para a pesquisa, profissionais de saúde segmentaram manualmente as mesmas imagens térmicas utilizadas nos testes de segmentação automática, para fins de comparação. Ao todo, quatro médicos que compõem a equipe de pesquisa participaram dos testes de segmentação, sendo duas médicas cardiopediatras, uma médica intensivista neonatal e um médico doutor em biologia aplicada à saúde. Informações adicionais sobre os mesmos podem ser obtidas no Anexo A. Um exemplo de saída da referida aplicação após as etapas de segmentação manual e automática é apresentada na Figura 34. Além disso, a aplicação também apresenta uma sobreposição das regiões de interesse obtidas por cada processo de segmentação, afim de apresentar de forma visual possíveis regiões
divergentes entre as segmentações manual e automática, como é ilustrada na Figura 35. Nas imagens apresentadas na Figura 34 (d) e na Figura 35, é possível constatar que a saída obtida na segmentação automática para o teste em questão foi bastante satisfatória, visto que é muito similar a saída obtida na segmentação manual, demonstrada na Figura 34 (e).
Figura 34 – Exemplo de saída da aplicação desenvolvida.
Fonte: Próprio Autor
Afim de mensurar quantitativamente possíveis perdas de informação na segmentação automática, foram calculadas a média de temperatura para cada região de interesse obtida a partir das segmentações manual e automática, além da diferença de temperatura entre as duas técnicas. Por fim, foi calculada a média da diferença de temperatura obtida durante os testes, que foi igual a 0,292ºC. Para o teste apresentado na Figura 34, a diferença de temperatura foi de 0,263ºC. A média obtida, considerada um valor baixo, confirma que a segmentação automática obteve uma baixa taxa de perda de informações de temperatura.
4.1.1 Módulo de Extração e Simulação de Características
A Figura 36 exibe o fluxo adotado para a extração e simulação de características. A partir das imagens térmicas de tronco obtidas a partir do modelo de referência para a segmentação automática, o módulo de extração de características gera um arquivo no Formato Attribute-Relation File Format (ARFF), um arquivo de texto ASCII que des- creve uma lista de instâncias que compartilham um conjunto de atributos. Os arquivos ARFF foram desenvolvidos pelo Machine Learning Project no Departamento de Ciências da Computação da Universidade de Waikato para uso com o software de aprendizado de
Figura 35 – Diferença visual entre as segmentações manual e automática do tronco do neonato da Figura 34, onde as regiões coloridas representam as regiões diver- gentes para cada técnica.
Fonte: Próprio Autor
máquina Weka (HALL et al., 2009), usado nos testes iniciais das arquiteturas de RNAs pro- postas. Uma implementação do algoritmo SMOTE foi utilizada para a geração sintética de vetores de características com o objetivo de ampliar as instâncias relacionadas a neonatos com PCA, visto a quantidade reduzida de imagens dessa classe. O pré-processamento, rea- lizado no arquivo ARFF a partir do software Weka (HALL et al., 2009), permitiu a geração de 49 instâncias sintéticas para neonatos com PCA. Assim, foram obtidas 56 instâncias de neonatos com PCA e 56 casos de bebês sem PCA.
Figura 36 – Fluxo adotado para a extração e simulação de características.
Fonte: Próprio Autor
Tabela 4 – Estudo do Teste de Precisão Vs. Tamanho do Conjunto de Dados. Com PCA Sem PCA Precisão (%) Amostras Tempo (s)
7 56 89 63 0,15
56 56 94 112 0,24
112 112 95 224 0,44
224 224 98 448 0,83
448 448 99 896 1,70
ras de RNA propostas pela pesquisa, além de criar um conjunto de dados base utilizados na calibração da aplicação PCA Diagnostic, sistema computacional desenvolvido para o auxílio ao diagnóstico de PCA, descrito em detalhes no Tópico 4.3.
4.1.2 Definição da Quantidade de Instâncias
De acordo com o que foi estabelecido na Seção 3.5, o conjunto de amostras adotado nos testes de treinamento de RNA foi dimensionado em 112 amostras. Um dos critérios adotados para fundamentar tal escolha foi a plotagem da curva de aprendizagem a partir da relação entre a quantidade de instâncias de dataset e a precisão na classificação da RNA adotada.
O Weka também foi utilizado, tanto na obtenção de dados de precisão em RNA quanto na geração de instâncias simuladas via SMOTE para composição de conjunto de dados com tamanhos diferentes. Nos testes, foi adotada a RNA citada na Seção 3.6, com 8 neurônios na camada oculta. As amostras foram selecionadas para as etapas de treinamento e testes de rede a partir da técnica de Validação Cruzada com 10 partições (10-fold), considerada padrão ouro na avaliação de desempenho de modelos de AM. Nela, as instâncias são divididas em k-partições ou dobras (folds) de mesmo tamanho. A RNA é treinada a partir de 𝑘 − 1 partições e testada a partir da última partição restante. Esse processo é repetido 𝑘 vezes, alternando as 𝑘 partições em cada iteração. Ao final das 𝑘 iterações, calcula-se a precisão média do modelo. Também foram computados o tempo em segundos que o Weka precisou para construir o modelo, considerando cada conjunto de dados. Os resultados obtidos podem ser verificados na Tabela 4 e a curva de aprendizagem gerada a partir de tais dados é apresentada na Figura 37.
Tais testes confirmaram que o balanceamento das instâncias de classe no conjunto de dados da pesquisa melhorou a precisão de classificação, de 89% para 94%, sem um aumento significativo no tempo de construção do modelo. Também era prevista uma me- lhora ainda mais significativa na precisão de classificação graças ao treinamento realizado a partir de conjuntos de instância maiores, porém o tempo de construção do modelo tam- bém aumentou. Também deve ser considerado a presença de ruído nos testes realizados em conjuntos de dados com mais de 112 instâncias, visto a quantidade de amostras si-
Figura 37 – Curva de Aprendizagem - Teste de Precisão Vs. Tamanho do Conjunto de Dados.
Fonte: Próprio Autor
muladas em maior quantidade. O conjunto composto por 112 instâncias, formado por uma quantidade menor de amostras simuladas, gerou um treinamento com uma precisão de classificação considerada satisfatória, sendo adotado como o tamanho mínimo do con- junto de dados a ser considerado nos testes de treinamento de rede, que serão descritos em detalhes a seguir.