Recherche de l’implication de BIN1 dans la pathogénicité de la maladie d’Alzheimer

Até o presente momento não foi encontrada nenhuma referência do emprego de redes baseadas no algoritmo NG dentro da área farmacêutica. Este trabalho, portanto, é o primeiro a descrever o uso e comparar o desempenho do algoritmo NG frente aos principais algoritmos usados em redes neurais não supervisionadas, inclusive em relação ao algoritmo que lhe deu origem, o SOM.

O desempenho da rede NG pode ser considerado perfeitamente apropriado para este conjunto de dados. A rede Neuras Gas reproduziu com o mais alto nível de fidelidade a topologia dos dados apresentados no espaço de entrada. Semelhantemente à classificação feita pela rede SOM há uma clara separação do conjunto em dois grandes agrupamentos de dados de alta similaridade, representados pelos planos principais que correspondem aos agrupamentos LCT e CEL. Entretanto, do ponto de vista comparativo, três regiões de fronteira foram claramente definidas (Figura 34A, baixo) e com isso os planos ficaram mais bem distribuídos, com os neurônios BMU 16 e 37 atuando como centros de massa do cluster LCT, enquanto que os neurônios BMU 13 e 41 atuam como centros de massa do cluster CEL, tornando a distribuição dos dados ainda mais uniforme do que na rede SOM. Essa boa distribuição suge- riu à inspeção visual, a existência de possíveis subagrupamentos menores.

Figura 38: Matriz-U 2D para as representações do algoritmo NG. Os números dentro do neurônio correspondem

aos rótulos dos dados que foram associados por esse neurônio.

Na inspeção da matriz-U bidimensional (Figura 37) essa definição fica visualmen- te mais clara. Pela disposição dos padrões de cores na grade neuronal infere-se intuitivamente a existência de dois subagrupamentos menores adjacentes aos dois grandes agrupamentos sugeridos pelos picos de fronteira menores ma matriz-U 3D:, um subgrupo MGS e outro TLC/ATP, demonstrando que a rede NG encontrou a distribuição mais coerente entre todas as redes não supervisionadas.

A análise do plano de componentes para o índice de Carr aponta que a classifica- ção seguiu rigorosamente o critério baseado em IC e FH (Figura 38). Pela simples inspeção visual é possível perceber que o critério semântico adotado pela rede segue um ordenamento lógico facilmente perceptível, onde os neurônios associados as entradas com boas propriedades de fluxo (vermelho e verde) e os neurônios associados a propriedades de fluxo inferiores ficam separados em planos bem distintos.

Figura 39: Gráfico do plano de componentes do índice de Carr para a rede NG. Vermelho: Excelente; Verde: Bom; Azul, Aceitável; Rosa: Pobre; Amarelo: Muito pobre. Abaixo, à direita, a matriz-U 2D

da rede.

Fonte: Dados da pesquisa

O mais notável é que os erros de classificação feitos pela rede SOM foram total- mente corrigidos na rede NG. Os neurônios relacionados ao rótulo 8 foram corretamente jus-

tapostos, formando um único subcluster ao lado do agrupamento CEL. Os dados referentes aos objetos 5 e 9 foram associados a neurônios que ficaram alocados num mesmo subgrupo, adotando uma representação topológica comum para os dois diferentes silicatos, TLC e ATP. Em síntese, a rede NG classificou o conjunto de dados de entrada em quatro diferentes agrupamentos: os dois maiores representando os diluentes, LAC e CEL; um agrupamento representando MGS; e um quarto agrupamento, representado os minerais ATP e TLC.

Conforme previamente discutido, a rede SOM pressupõe uma determinação pré- via na distribuição neuronal das vizinhanças. Um dos objetivos do algoritmo NG quando foi implementado seria contornar possíveis erros de vetorização veiculados por essa característica do SOM. A estratégia usada para modificar o SOM consistiu em estruturar o algoritmo de tal forma que as variações nos pesos sinápticos wj, não fossem definidas pelo arranjo dos neu- rônios dentro de uma rede com vizinhança pré estruturado, mas pelas distâncias relativas entre os neurônios dentro do espaço de entrada, conforme a dedução à página 36, onde a regra de adaptação pode ser considerada como a regra do vencedor leva mais ao invés de "o vence- dor leva tudo" (MARTINETZ e SCHULTEN, 1991).

Cada item de dado é apresentado à rede à cada iteração, de tal forma que as rela- ções topológicas entre os neurônios são instaladas durante o treinamento. Isto confere à rede NG uma condição muito mais flexível para ajustes dos pesos de neurônios vizinhos, e essa flexibilidade permitiu que a rede NG fosse mais sensível no reconhecimento das similaridades entre os neurônios dos subclusters MGS, TLC e ATP, e também contornando o problema de métrica encontrado pela rede SOM para o estabelecimento de uma região de fronteira apropri- ada para a delimitação desses subclusters (SCHULTEN e MARTINETZ, 1991; VILLMANN e CLAUSSEN, 2006).

Essa adequação perfeita da rede NG ao conjunto de dados ainda conferiu outra vantagem adicional à Neural Gas: o sistema de rotulagem das categorias de propriedades por cores permite verificar de uma forma direta e muito clara quais os excipientes ou misturas de excipientes apresentavam características de fluxo apropriadas ou não. Essa característica mostrou que uma plataforma baseada numa rede NG tem potencial para emprego em softwares de classificação de misturas de pós farmacêuticos baseados em propriedades de fluxo em categorias que podem determinar se um sistema pulverulento pode estar apropriado, do ponto de vista de fluxo, a determinadas exigências tecnológicas.

6 CONCLUSÕES

No processo de desenvolvimento, a partir de quatro redes neurais protótipos de- senvolvidas inicialmente, foi implementada uma RNA supervisionada MLP feedfoward com 8 neurônios de entrada, 16 neurônios escondidos e 1 neurônio de saída, usada para análise preditiva sobre três parâmetros reológicos, IC, FH e . O aprendizado de rede e a capacidade preditiva em relação a foi deficiente, enquanto que em para a IC e FH a capacidade preditiva foi superior a 93%, credenciando esse dois parâmetros como bons descritores para a etapa seguinte de desenvolvimento de uma RNA.

As performances de cinco algoritmos foi comparada quanto à capacidade de clas- sificação de sistemas pulverulentos baseada em parâmetros reológicos. As redes neurais baseadas no paradigma "o vencedor leva tudo", WTA, RPCL e FSCL, fizeram uma classificação muito pobre e deficiente dos sistemas pulverulentos. Embora essas três redes tenham reconhe- cido agrupamentos no espaço de entrada, todas as classificações apresentaram erros grossei- ros, agrupando equivocadamente pós com propriedades díspares e conflitantes, e não foi pos- sível estabelecer qual o critério de classificação automática adotado pelas redes. As redes, portanto, não mostraram viabilidade prática para os sistemas estudados nessas condições, po- rém não está descartada sua otimização a partir de ajustes de parâmetros que venham a favo- recer o desempenho desses algoritmos.

As redes competitivo-cooperativas, distinguiram os grandes agrupamentos de dados com alto nível de afinidade dentro da massa de dados apresentada e reproduziram com bastante fidelidade o espaço de dados de entrada, comprovando uma elevada capacidade clas- sificatória. Pôde-se inferir com clareza que CI e HR foram os critérios adotados pelas duas redes para classificação automática dos dados.

A performance de classificação da rede SOM foi muito boa em comparação com as redes puramente competitivas. A rede SOM reconheceu e classificou corretamente os dados dos conjuntos LAC e CEL em agrupamento claramente separados, porém apresentou erros de classificação dos dados de MGS, TLC e ATP, e foi incapaz de reconhecer estabelecer com clareza as fronteiras para delimitar esses subclusters.

A rede NG apresentou uma capacidade excelente de classificação e de representa- ção topológica dos dados de entrada, e sem apresentar os erros de classificação mostrados

pela rede SOM. Os dados dos conjuntos LAC e CEL foram classificando com precisão em dois grandes clusters claramente distintos entre si. Os dados de MGS, TLC e ATA foram alocados corretamente em subclusters específicos, facilmente distinguíveis no sistema de classi- ficação por cores adotados na matriz-U bidimensional, reproduzindo o espaço de entrada com o nível máximo de fidelidade esperado.

A rede NG classificou a ATP, um mineral ainda em estudo quanto ao emprego como excipiente farmacêutico, no mesmo subcluster ou categoria do TLC quanto às suas propriedades reológicas, demonstrando sensibilidade suficiente para distinguir e identificar sistemas pulverulentos de características desconhecidas e eventualmente contaminantes, dentro de um conjunto conhecido de pós ou sistemas pulverulentos. A rede Neural Gas, portanto, mostrou-se promissora para o desenvolvimento de softwares para uso na classificação auto- matizada de sistemas pulverulentos farmacêuticos.

A rotulagem por cores para as classes de atributos classificativos, CI e HR, por sua vez, também provou ser um sistema simples e bastante intuitivo para classificação de sistemas pulverulentos quanto às propriedades de fluxo quando à categorização (bom, aceitável e mau), tendo potencial para utilização em sistemas automáticos de classificação.

Este trabalho foi o primeiro na descrição do emprego de uma rede não supervisio- nada baseada no algoritmo Neural Gas no desenvolvimento de produtos farmacêuticos. Com ele foi possível avaliar o desempenho do algoritmo NG em comparação com os principais algoritmos usados em redes neurais não supervisionadas.

Dans le document Analyse d’un nouveau modèle transgénique murin d’Alzheimer à début tardif basé sur la surexpression de BIN1 et induisant des endophénotypes précliniques de la maladie (Page 82-88)