• Aucun résultat trouvé

3. Education scientifique et histoire des sciences : émergence

3.2. Histoire des sciences et développement cognitif : le point de

O simulador de redes neurais utilizado foi o “Java Neural Network Simulator” desenvolvido pelo Instituto Wilhem-Schickard para Ciência da Computação (WSI) em Tübingen, Alemanha. Este simulador é baseado no Stuttgart Neural Network Simulator 4.2 Kernel (Zell et al., 1996), com uma nova interface gráfica. O algoritmo de aprendizado utilizado foi o “backpropagation” desenvolvido nos anos 80, que é um algoritmo de classificação supervisionada, o que significa que para cada padrão de entrada na rede existe um padrão de saída estabelecido. O algoritmo de aprendizado é baseado na modificação dos pesos de conexão dos neurônios, de modo a se obter o comportamento desejado do sistema. Esta modificação é freqüentemente baseada na regra de Hebb (Hebb, 1949). De acordo com esta regra, uma ligação entre duas unidades é fortalecida se ambas as unidades estão ativas ao mesmo tempo (Vieira, 2000).

A utilização de redes neurais evita o problema de dedução de fórmulas ou estabelecimento de regras para solução de um determinado problema e somente requerem o conhecimento de qual informação é relevante para solução do problema. Assim, os dados devem ser representativos das classes com as quais estão associados.

A utilização de uma rede neural se inicia com o processo de treinamento da rede. Para tanto, inicialmente foram coletados dois conjuntos de amostras, um para treinamento da rede e outro para validação ou teste, coletados de modo independente um do outro. Além disso, um conjunto selecionado aleatoriamente, pode enfatizar demais certas relações e negligenciar outras. Assim, é preferível utilizar opiniões de especialistas para selecionar uma variedade maior de padrões.

No caso da classificação pelo MAXVER, Swain (1978) e Mather (1999) recomendam que uma amostra de treinamento representativa, para o caso multivariado, deve ter pelo menos 30 vezes o número de variáveis discriminantes por classe. Sendo assim, o número de amostras para treinamento foi estipulado em 300 para cada classe, ou seja, mais do que 30 vezes o número de variáveis discriminantes (8) utilizadas, tanto para classificação pelas redes neurais quanto para a classificação pelo MAXVER. Por sua vez, o tamanho do conjunto de validação foi determinado em 150 amostras,

conforme sugerido por Zhu (2000). A coleta das amostras foi realizada no software ERDAS Imagine 8.5 e estas foram distribuídas aleatoriamente na área da bacia (amostra estratificada), sempre buscando capturar um conjunto que representasse o máximo possível as características de cada classe.

Após este procedimento, foram realizados o treinamento e a validação propriamente ditos das amostras pelo classificador por redes neurais. Diferentes arquiteturas foram testadas: variando o número de neurônios na camada de entrada, correspondentes ao número de variáveis discriminantes utilizadas; variando o número de neurônios na camada interna e/ou números de camadas internas; e todas tendo o mesmo número de neurônios na camada de saída (12 classes de solo para a Área 1 e 10 para a Área 2).

O número de neurônios da(s) camada(s) interna(s) foi determinado através de tentativa e erro, conforme sugerido por Hirose et al. (1991). Este procedimento começa com uma rede pequena composta de uma camada de entrada e uma de saída, as quais definem, respectivamente o número de variáveis discriminantes e o número de classes informacionais envolvidas em um determinado problema, com somente um neurônio na camada interna. O critério utilizado para adicionar neurônios na camada interna é baseado no comportamento do erro durante a fase de treinamento. Desta maneira, o erro do treinamento foi usado como critério para avaliar o desempenho da rede. O erro do treinamento mede a diferença entre os valores estimados e os valores desejados para o conjunto de treinamento.

O treinamento das redes utilizando um aprendizado supervisionado consistiu dos seguintes procedimentos:

a) alocação aleatória dos pesos interneurônios. Os pesos foram inicializados com valores aleatórios pequenos (entre -0,5 e 0,5) para evitar o problema de que a rede neural seja saturada com valores grandes, ou a dificuldade da rede não aprender, devido à presença de valores homogêneos (Vieira, 2000);

b) Se os padrões estudados não são muito distintos, eles podem não ser classificados de acordo com os resultados desejados, o que resultará em menor valor na taxa de aprendizado (η). Por outro lado, isto implicará em um treinamento mais lento,

esperados quando todos os padrões de treinamento são completamente distintos, ou seja, quando existe um padrão de cada tipo no conjunto de dados de treinamento (Vieira, 2000). A determinação da taxa de aprendizado para um problema específico não é uma tarefa simples. Valores típicos de η estão na faixa de 0,1 a 1,0. Poucos são os exemplos onde o treinamento é mais rápido, com valores acima de 1,0. Algumas vezes o valor de

η apropriado para começar o treinamento é inapropriado quando uma rede alcança pontos mais próximos ao seu mínimo global ao término do treinamento (Cauldill, 1991).

c) utilização de uma taxa de aprendizado de 0,2, considerando 10.000 ciclos de aprendizagem.

Por último, ao final de todo o processo de treinamento, as redes foram submetidas à validação para escolha daquela(s) que seria(m) utilizada(s) na discriminação dos solos da área estudada.

Finalmente, a rede escolhida em cada unidade litológica considerada foi utilizada na predição das classes de solos da bacia do rio São Domingos. Para computar a classe de solo que ocorre em um determinado pixel, os valores das variáveis discriminantes para aquele pixel foram introduzidos na rede treinada como dados de entrada. A rede, então, computou o resultado correspondente contendo os níveis de ativação no neurônio de saída. Assim, quando todos os pixels foram visitados pela rede, foi produzida uma representação das classes de solos identificadas na bacia do rio São Domingos.

Na abordagem por redes neurais, o resultado final da avaliação atribuído a um determinado pixel é dado em termos de porcentagem de este pixel pertencer a uma das classes de solos identificadas na bacia. Deste modo, o mapa de solos obtido por esta abordagem foi produzido através da conversão da representação de similaridade (Zhu, 2000) para uma representação booleana. Esta conversão foi feita adicionando-se a cada pixel o valor correspondente à classe que apresentou a maior porcentagem entre todas as envolvidas (Zhu, 1997).

A fim de permitir uma comparação entre classificadores distintos, as mesmas amostras utilizadas no treinamento e validação das redes neurais foram utilizadas no

verossimilhança (MAXVER). Esta etapa foi implementada no executável denominado “Funcpow.exe” desenvolvido por Vieira (2000). A opção pelo emprego deste executável se deve à possibilidade de utilização dos mesmos formatos de arquivos de treinamento e validação que foram usados para a classificação pelas redes neurais.

Os resultados obtidos pelos classificadores utilizados foram manipulados no software ERDAS Imagine 8.5 para produzir os mapas finais das classes de solos da bacia do rio São Domingos.