Até o presente momento não foi encontrada nenhuma referência do emprego de redes baseadas no algoritmo NG dentro da área farmacêutica. Este trabalho, portanto, é o pri- meiro a descrever o uso e comparar o desempenho do algoritmo NG frente aos principais al- goritmos usados em redes neurais não supervisionadas, inclusive em relação ao algoritmo que lhe deu origem, o SOM.
O desempenho da rede NG pode ser considerado perfeitamente apropriado para este conjunto de dados. A rede Neuras Gas reproduziu com o mais alto nível de fidelidade a topologia dos dados apresentados no espaço de entrada. Semelhantemente à classificação feita pela rede SOM há uma clara separação do conjunto em dois grandes agrupamentos de dados de alta similaridade, representados pelos planos principais que correspondem aos agrupamen- tos LCT e CEL. Entretanto, do ponto de vista comparativo, três regiões de fronteira foram claramente definidas (Figura 34A, baixo) e com isso os planos ficaram mais bem distribuídos, com os neurônios BMU 16 e 37 atuando como centros de massa do cluster LCT, enquanto que os neurônios BMU 13 e 41 atuam como centros de massa do cluster CEL, tornando a distribuição dos dados ainda mais uniforme do que na rede SOM. Essa boa distribuição suge- riu à inspeção visual, a existência de possíveis subagrupamentos menores.
Figura 38: Matriz-U 2D para as representações do algoritmo NG. Os números dentro do neurônio correspondem
aos rótulos dos dados que foram associados por esse neurônio.
Na inspeção da matriz-U bidimensional (Figura 37) essa definição fica visualmen- te mais clara. Pela disposição dos padrões de cores na grade neuronal infere-se intuitivamente a existência de dois subagrupamentos menores adjacentes aos dois grandes agrupamentos sugeridos pelos picos de fronteira menores ma matriz-U 3D:, um subgrupo MGS e outro TLC/ATP, demonstrando que a rede NG encontrou a distribuição mais coerente entre todas as redes não supervisionadas.
A análise do plano de componentes para o índice de Carr aponta que a classifica- ção seguiu rigorosamente o critério baseado em IC e FH (Figura 38). Pela simples inspeção visual é possível perceber que o critério semântico adotado pela rede segue um ordenamento lógico facilmente perceptível, onde os neurônios associados as entradas com boas proprieda- des de fluxo (vermelho e verde) e os neurônios associados a propriedades de fluxo inferiores ficam separados em planos bem distintos.
Figura 39: Gráfico do plano de componentes do índice de Carr para a rede NG. Vermelho: Excelente; Verde: Bom; Azul, Aceitável; Rosa: Pobre; Amarelo: Muito pobre. Abaixo, à direita, a matriz-U 2D
da rede.
Fonte: Dados da pesquisa
O mais notável é que os erros de classificação feitos pela rede SOM foram total- mente corrigidos na rede NG. Os neurônios relacionados ao rótulo 8 foram corretamente jus-
tapostos, formando um único subcluster ao lado do agrupamento CEL. Os dados referentes aos objetos 5 e 9 foram associados a neurônios que ficaram alocados num mesmo subgrupo, adotando uma representação topológica comum para os dois diferentes silicatos, TLC e ATP. Em síntese, a rede NG classificou o conjunto de dados de entrada em quatro diferentes agru- pamentos: os dois maiores representando os diluentes, LAC e CEL; um agrupamento repre- sentando MGS; e um quarto agrupamento, representado os minerais ATP e TLC.
Conforme previamente discutido, a rede SOM pressupõe uma determinação pré- via na distribuição neuronal das vizinhanças. Um dos objetivos do algoritmo NG quando foi implementado seria contornar possíveis erros de vetorização veiculados por essa característica do SOM. A estratégia usada para modificar o SOM consistiu em estruturar o algoritmo de tal forma que as variações nos pesos sinápticos wj, não fossem definidas pelo arranjo dos neu- rônios dentro de uma rede com vizinhança pré estruturado, mas pelas distâncias relativas entre os neurônios dentro do espaço de entrada, conforme a dedução à página 36, onde a regra de adaptação pode ser considerada como a regra do vencedor leva mais ao invés de "o vence- dor leva tudo" (MARTINETZ e SCHULTEN, 1991).
Cada item de dado é apresentado à rede à cada iteração, de tal forma que as rela- ções topológicas entre os neurônios são instaladas durante o treinamento. Isto confere à rede NG uma condição muito mais flexível para ajustes dos pesos de neurônios vizinhos, e essa flexibilidade permitiu que a rede NG fosse mais sensível no reconhecimento das similaridades entre os neurônios dos subclusters MGS, TLC e ATP, e também contornando o problema de métrica encontrado pela rede SOM para o estabelecimento de uma região de fronteira apropri- ada para a delimitação desses subclusters (SCHULTEN e MARTINETZ, 1991; VILLMANN e CLAUSSEN, 2006).
Essa adequação perfeita da rede NG ao conjunto de dados ainda conferiu outra vantagem adicional à Neural Gas: o sistema de rotulagem das categorias de propriedades por cores permite verificar de uma forma direta e muito clara quais os excipientes ou misturas de excipientes apresentavam características de fluxo apropriadas ou não. Essa característica mos- trou que uma plataforma baseada numa rede NG tem potencial para emprego em softwares de classificação de misturas de pós farmacêuticos baseados em propriedades de fluxo em catego- rias que podem determinar se um sistema pulverulento pode estar apropriado, do ponto de vista de fluxo, a determinadas exigências tecnológicas.
6 CONCLUSÕES
No processo de desenvolvimento, a partir de quatro redes neurais protótipos de- senvolvidas inicialmente, foi implementada uma RNA supervisionada MLP feedfoward com 8 neurônios de entrada, 16 neurônios escondidos e 1 neurônio de saída, usada para análise pre- ditiva sobre três parâmetros reológicos, IC, FH e . O aprendizado de rede e a capacidade preditiva em relação a foi deficiente, enquanto que em para a IC e FH a capacidade prediti- va foi superior a 93%, credenciando esse dois parâmetros como bons descritores para a etapa seguinte de desenvolvimento de uma RNA.
As performances de cinco algoritmos foi comparada quanto à capacidade de clas- sificação de sistemas pulverulentos baseada em parâmetros reológicos. As redes neurais base- adas no paradigma "o vencedor leva tudo", WTA, RPCL e FSCL, fizeram uma classificação muito pobre e deficiente dos sistemas pulverulentos. Embora essas três redes tenham reconhe- cido agrupamentos no espaço de entrada, todas as classificações apresentaram erros grossei- ros, agrupando equivocadamente pós com propriedades díspares e conflitantes, e não foi pos- sível estabelecer qual o critério de classificação automática adotado pelas redes. As redes, portanto, não mostraram viabilidade prática para os sistemas estudados nessas condições, po- rém não está descartada sua otimização a partir de ajustes de parâmetros que venham a favo- recer o desempenho desses algoritmos.
As redes competitivo-cooperativas, distinguiram os grandes agrupamentos de da- dos com alto nível de afinidade dentro da massa de dados apresentada e reproduziram com bastante fidelidade o espaço de dados de entrada, comprovando uma elevada capacidade clas- sificatória. Pôde-se inferir com clareza que CI e HR foram os critérios adotados pelas duas redes para classificação automática dos dados.
A performance de classificação da rede SOM foi muito boa em comparação com as redes puramente competitivas. A rede SOM reconheceu e classificou corretamente os da- dos dos conjuntos LAC e CEL em agrupamento claramente separados, porém apresentou er- ros de classificação dos dados de MGS, TLC e ATP, e foi incapaz de reconhecer estabelecer com clareza as fronteiras para delimitar esses subclusters.
A rede NG apresentou uma capacidade excelente de classificação e de representa- ção topológica dos dados de entrada, e sem apresentar os erros de classificação mostrados
pela rede SOM. Os dados dos conjuntos LAC e CEL foram classificando com precisão em dois grandes clusters claramente distintos entre si. Os dados de MGS, TLC e ATA foram alo- cados corretamente em subclusters específicos, facilmente distinguíveis no sistema de classi- ficação por cores adotados na matriz-U bidimensional, reproduzindo o espaço de entrada com o nível máximo de fidelidade esperado.
A rede NG classificou a ATP, um mineral ainda em estudo quanto ao emprego como excipiente farmacêutico, no mesmo subcluster ou categoria do TLC quanto às suas pro- priedades reológicas, demonstrando sensibilidade suficiente para distinguir e identificar sis- temas pulverulentos de características desconhecidas e eventualmente contaminantes, dentro de um conjunto conhecido de pós ou sistemas pulverulentos. A rede Neural Gas, portanto, mostrou-se promissora para o desenvolvimento de softwares para uso na classificação auto- matizada de sistemas pulverulentos farmacêuticos.
A rotulagem por cores para as classes de atributos classificativos, CI e HR, por sua vez, também provou ser um sistema simples e bastante intuitivo para classificação de sis- temas pulverulentos quanto às propriedades de fluxo quando à categorização (bom, aceitável e mau), tendo potencial para utilização em sistemas automáticos de classificação.
Este trabalho foi o primeiro na descrição do emprego de uma rede não supervisio- nada baseada no algoritmo Neural Gas no desenvolvimento de produtos farmacêuticos. Com ele foi possível avaliar o desempenho do algoritmo NG em comparação com os principais algoritmos usados em redes neurais não supervisionadas.