CHAPITRE III :LE PILOTAGE DES FLUX
III.6 L’amélioration des performances
III.6.3 Le reengineering
Com o presente estudo pretende-se verificar a influência de diferentes condições operacionais, mais especificamente, diferentes equipamentos de análise por GC-MS e diferentes operadores, nas capacidades de previsão da origem de ramas petrolíferas por redes de Kohonen. Para tal, as amostras da base de dados de trabalho foram separadas em função dos seus operadores (que utilizaram equipamentos distintos mas com o mesmo tipo de colunas cromatográficas), sendo o conjunto de treino constituído pelas amostras por mim obtidas e o conjunto de teste constituído pelas amostras analisadas por Biscaya
[6]
.
Tal como para os estudos anteriores, foram efectuados diversos testes, tendo-se concluído que as redes que apresentavam melhor agrupamento de classes e menor número de áreas indeterminadas eram as redes de dimensão 15×15, com RIA=7 e submetidas a treino durante 50 ciclos.
Na figura seguinte apresenta-se o mapa de Kohonen resultante do treino da primeira rede obtida nas condições acima determinadas, encontrando-se nele assinalados os neurónios activados pelas as amostras do conjunto de treino. Novamente, os neurónios incorrectamente activados têm assinalado, no seu canto inferior direito, o rótulo correcto das amostras respectivas.
Figura 3.15 – Mapa de Kohonen de dimensão 15×15 e RIA=7, resultante do treino com
201 amostras representadas por 22 descritores. Estão mapeados os neurónios activados pelo conjunto de treino.
Também neste caso as amostras se agrupam geralmente consoante a sua origem geográfica. À semelhança do que se verificou nos estudos anteriores, também aqui existe dispersão de algumas classes por mais do que uma área do mapa, sendo novamente as classes D e E que contribuem maioritariamente para este efeito.
Para o caso particular da rede aqui apresentada, foram cinco as amostras incorrectamente classificadas, amostras essas que se podem consultar na Tabela 3.6.
Para o conjunto de treino submetido a esta rede obtém-se uma percentagem de previsões correctas de 98%.
Tabela 3.6 – Resultados das amostras do conjunto de treino incorrectamente
classificadas pela rede 1.
Amostra Classe Atribuição pela rede
BNL9 w-1 E – Nigéria D – Arábia DUB10 w2 D – Arábia E – Nigéria ARL503 w2 D – Arábia E – Nigéria BUR519 w19 F – Rússia E – Nigéria MUR330 w29 B – África D – Arábia
Submetendo o conjunto de teste à mesma rede, obtém-se o mapeamento constante da figura seguinte. Neste caso, o que se verifica é que, apesar de se estarem a comparar resultados obtidos com equipamentos laboratoriais distintos e diferentes operadores se obtém uma taxa de previsões correctas bastante elevada, de 77% e apenas 7% de previsões erradas.
Figura 3.16 – Mapa de Kohonen de dimensão 15×15 e RIA=7, resultante do treino com
201 amostras representadas por 22 descritores. Estão mapeados os neurónios activados pelo conjunto de teste, contendo 62 amostras.
Realça-se aqui o facto de serem as amostras provenientes de duas ramas petrolíferas (MUR334 e QNG338) a contribuírem com a quase totalidade das
previsões incorrectas (12 num total de 14) para os resultados obtidos, o que parece indicar que estas ramas não conseguem ser bem previstas por esta rede específica. Contudo, a maioria das amostras mal classificadas activaram neurónios adjacentes às zonas a que pertencem, pelo que é de supor que existem particularidades nestas duas ramas que as diferenciam ligeiramente das restantes ramas com as mesmas origens.
À semelhança do efectuado nos estudos anteriores, treinaram-se 5 redes independentes para previsões por consenso, obtendo-se uma percentagem de 98% de previsões correctas para o conjunto de treino.
Também os conjuntos de teste foram de seguida submetidos às cinco redes que conduziam às melhores previsões para o conjunto de treino. De modo a tentar melhorar os resultados das previsões para os diversos conjuntos em análise, as redes foram consideradas em conjunto, aplicando-se as medidas de tomada de decisão. Os resultados obtidos encontram-se sistematizados na Tabela 3.7, e na Tabela 3.8 encontram-se os resultados das previsões por consenso obtidas para o conjunto de teste, descriminados em função do grau de confiança. Os resultados obtidos para cada uma das amostras do conjunto de teste estão compilados no Anexo 5.
Tabela 3.7 – Previsões para as amostras do conjunto de treino e de teste para o estudo
de comparação de condições operatórias diversas geradas por 5 redes individuais (de dimensão 15×15 e RIA=7) e pelo seu conjunto
Rede 1 2 3 4 5 Consenso Correctas 196 194 199 196 199 200 % 97,5 96,5 99,0 97,5 99,0 99,5 Erradas 5 3 2 3 0 1 % 2,5 1,5 1,0 1,5 0 0,5 Indeterminadas 0 4 0 2 2 0 Treino (201 amostras) % 0 2,0 0 1,0 1,0 0 Correctas 48 55 47 48 59 59 % 77,4 88,7 75,8 77,4 95,2 95,2 Erradas 4 2 9 12 2 3 % 6,5 3,2 14,5 19,4 3,2 4,8 Indeterminadas 10 5 6 2 1 0 Teste (62 amostras) % 16,1 8,1 9,7 3,2 1,6 0
Para o presente caso, verifica-se, com a introdução do conceito de decisão por aplicação a múltiplas redes treinadas com o mesmo conjunto, uma enorme melhoria na qualidade das em especial no que se refere ao conjunto de teste, em que a previsão passa de uma média de 83% para as redes individuais para 95% quando se toma o conjunto das redes.
Aliás, este facto é especialmente marcado quando se comparam os resultados obtidos para as duas ramas cujas amostras geraram previsões incorrectas quando submetidas apenas à rede individual mostrada na figura 3.16. Enquanto que neste caso se têm 12 amostras (num total de 14) incorrectamente classificadas, em geral as previsões foram corrigidas quando a decisão foi tomada com base na previsão por consenso, passando a existir apenas uma previsão errada. No entanto as previsões por consenso obtidas, ao atribuir para estas amostras um grau de confiança entre 2 e 4, deram indicações de dificuldades na classificação.
Quanto às previsões erradas, correspondem às amostras QNG338 w2, SOY412 w19 e SOY412 w29, todas elas pertencentes à classe C (Angola) e erradamente atribuídas à classe F (Nigéria). Para além disto, são as restantes amostras destas ramas as que apresentam previsões com menor grau de confiança em todo o conjunto de teste (geralmente 2 ou 3).
Observando a listagem apresentada na Tabela 2.1, que contém as ramas cujas amostras constituem o conjunto de treino, verifica-se que o mesmo contém uma rama Quinguila e nenhuma rama Soyo. Isto pode contribuir para os resultados encontrados, pois depósitos diferentes com a mesma origem geográfica podem apresentar diferenças menores na sua constituição que levem a uma classificação incorrecta caso a rede, não contenha (ou contenha apenas em pequena quantidade), no seu conjunto de treino, de amostras que contemplem as referidas diferenças.
Apenas para este estudo esta situação se verificou, pois foi a única em que a rama Soyo estava presente no conjunto de teste e ausente do conjunto de treino.
Tabela 3.8 – Descriminação das previsões por consenso obtidas com o conjunto de teste
em função do seu grau de confiança para o estudo de comparação de condições operatórias diversas.
Grau de Confiança 5 4 3 2 Nº 186 11 3 0 Previsões Certas % 100 91,7 75 0 Nº 0 1 1 1 Conjunto de Teste (69 amostras) Previsões Erradas % 0 8,3 25 100
As conclusões já traçadas para os estudos anteriores são também válidas para o presente estudo, ou seja, uma elevada fiabilidade para amostras cujas previsões por consenso apresentem um alto grau de confiança e a hipótese de suspeitar de previsões por consenso com um baixo grau de confiança