• Aucun résultat trouvé

Accumulation en continu des ´etats m´etastables dans le pi`ege optique . 43

EP – Exactidão do Produtor; EU – Exactidão do Utilizador

Figura 17 – Matrizes de confusão dos melhores testes de classificação

Quanto ao mapa produzido através CAD/Abril+Julho, relativamente à exactidão do produtor (EP), apenas três classes, têm valores superiores a 80%. Estas são: corpos

51

a classe com menor valor de EP é a classe 4 (culturas agrícolas de sequeiro +

vegetação herbácea natural), com 22%. No que diz respeito à exactidão do utilizador

(EU), as classes menos problemáticas são as classe 4 (culturas agrícolas de sequeiro +

vegetação herbácea natural), com 67%, e a classe 5 (matos), com 78% de EU. A classe

com menor valor de EU é a classe 7 (culturas permanentes perenifólias) com um valor de EU de 3%.

A confusão entre as restantes classes é indiferenciada, isto é, esta ocorre tanto em classes espectralmente próximas como em classes afastadas. O exemplo de uma confusão entre classes espectralmente próximas é a existente entre a classe 4 (culturas

agrícolas de sequeiro + vegetação herbácea natural) e a classe 7 (culturas permanentes perenifólias). Esta confusão é devido à influência do subcoberto herbáceo que é comum

em ambas as classes, o que acaba por confundir classes diferentes do ponto de vista da ocupação (devido à presença ou ausência do estrato arbóreo), mas que espectralmente revelam-se semelhantes.

Outro exemplo de confusão é a que se observa entre a classe 3 (Áreas urbanas

descontínuas) e a classe 4 (culturas agrícolas de sequeiro + vegetação herbácea natural). Esta confusão está relacionada com a heterogeneidade da classe 3 que engloba

construção dispersa com áreas de subcoberto ou ocupação dominada por estrato herbáceo, dificultando a sua identificação ao nível do pixel. Por outro lado, poderá ser relevante o facto da maior parte da área urbana existente na área de estudo, ser pequena e dispersa, o que aumenta a probabilidade de heterogeneidade dos pixels, aumentando a probabilidade de confusão com os pixels adjacentes.

Um exemplo de confusão entre classes espectralmente diferentes é a que ocorre entre a classe 5 (matos) e a classe 1 (corpos de água). Este facto é revelador de grandes dificuldades na classificação, porque esta confusão não é explicável nem por semelhanças espectrais, nem pela semântica das classes envolvidas. Este tipo de confusão poderá dever-se à qualidade ou pureza das amostras de treino.

Outra razão que poderá explicar esta confusão na classificação é o facto da metade Sul da área de estudo se localizar na Serra do Caldeirão, numa área com um relevo acidentado e de encostas declivosas. Talvez haja um efeito do ensombramento das encostas viradas a Norte nessas áreas que são de facto ocupadas na sua maioria por vegetação arbustiva.

52

Os valores de exactidão global mostram, e os índices específicos assim o confirmam, que existe elevada confusão entre a maior parte das classes. Estes não permitem tirar elações mais profundas quanto à confusão entre elas.

Os resultados do teste 4 também indicam que existe confusão entre classes semanticamente muito diferentes A confusão é muito elevada, considerando que o mapa produzido tem apenas cinco classes bem distintas. Observa-se que existe confusão entre as classes floresta (3), áreas urbanas (2) e água (1). Isto indica que as classes são muito heterogéneas, o que poderá confirmar o que foi verificado pela análise da matriz de confusão anterior, ou seja, que existe confusão entre classes teoricamente distintas espectralmente.

Nas duas matrizes de confusão apresentadas, os valores de exactidão específica mostram confusão na classificação entre a maior parte das classes. Este facto verifica-se tanto em classes espectralmente próximas como em classes espectralmente afastadas. Isto pode indicar que as classes das amostras de treino são muito heterogéneas e pouco discriminatórias.

4.3C

ÁLCULO DA DISTÂNCIA ENTRE CLASSES DA AMOSTRA DE

TREINO

Para avaliar a distância entre as classes de ocupação do solo das amostras de treino, produziram-se três dendrogramas (Figura 18). Nestes, o eixo das abcissas indica a distância entre os centros do espaço dimensional característico de cada classe. Quanto maior for esse valor, maior será a distância entre as classes de ocupação do solo. Por outro lado, conforme a distância (valor na abcissa) observam-se quais as classes que espectralmente têm uma resposta mais semelhante.

53 Bandas: Abril e Julho

Bandas: Abril, Julho e NDVI de Abril e Julho

Bandas: Componentes Principais de Abril e Julho Figura 18 – Dendrogramas das assinaturas

54

Analisando os dois primeiros dendrogramas (Figura 18), estes são muito semelhantes e verifica-se que nas maiores distâncias há uma separação nítida de três agrupamentos: planos de agua (1), classes sem ou pouca vegetação e classes com vegetação. As classes de vegetação esparsa (6) com áreas urbanas contínuas (2) encontram-se muito próximas. São áreas praticamente sem vegetação ao longo do tempo (primavera - verão), daí advêm as suas semelhanças espectrais. A classe novas

plantações/arborizações (8) e a classe vegetação herbácea natural e sequeiros (4)

formam um agrupamento. Esta situação estará relacionada com o efeito da presença do subcoberto herbáceo. Este agrupamento ainda se aglomera, mas a uma maior distância, à classe de áreas urbanas descontínuas (3) que também, devido à presença do mesmo subcoberto, assemelha-se espectralmente às duas anteriores. As classes floresta aberta

de folhosas (10) e culturas permanentes perenifólias (pomares, olivais) (7) encontram-

se muito próximas, provavelmente devido a estruturas semelhantes ao nível das proporções de ocupação por parte dos estratos arbóreos e herbáceos. A classe floresta

fechada folhosas (9) e matos (5) também estão muito próximas, o que seria espectável,

considerando que se tratam de folhosas e vegetação perenifólias e que na ocupação não existe dominância ou presença do estrato herbáceo.

O dendrograma resultante da análise cluster aplicada às assinaturas espectrais, obtidas a partir da análise de componentes principais com as imagens de Abril e Julho, mostrou um resultado que difere ligeiramente dos dois anteriormente apresentados.

Neste caso, a classe novas plantações/arborizações (8) está muito próxima da classe floresta aberta de folhosas (10), o que semanticamente está correcto, considerando que ambas são classes de ocupação florestal. A classe culturas

permanentes perenifólias (pomares, olivais) (7) está numa distância que coloca esta

assinatura numa posição de transição entre dois agrupamentos de classes claramente distintos. Por um lado, existe um agrupamento composto por duas classes com alguma dominância do estrato herbáceo: vegetação herbácea natural e sequeiros (4) e a classe de áreas urbanas descontínuas (3); por outro lado, o agrupamento anteriormente descrito, é composto pelas classes novas plantações/arborizações (8) e floresta aberta

de folhosas (10).

Pela análise dos dendrogramas das assinaturas espectrais, todos os clusters podem ser explicados, porém as assinaturas resultantes da análise de componente

55

principais parecem estar espectralmente mais em consonância com a semântica das classes definidas de ocupação do solo. Estes resultados são um indicador de robustez da amostra de treino quanto à separação das classes. Por outro lado, embora o tamanho da área de estudo e a complexidade da paisagem condicionassem fortemente essa recolha, o número de unidades amostrais é superior ou igual ao mínimo estatisticamente definido (Capitulo 3.3) em todas as classes da nomenclatura, o que reforça a robustez da amostra de treino e das assinaturas resultantes dos diferentes conjuntos de dados utilizados.

Face aos resultados obtidos na avaliação da exactidão temática dos mapas, os resultados da análise da amostra de treino parecem indicar que os baixos valores de exactidão temática obtidos devem-se aos conjuntos classificadores/dados utilizados.

4.4A

NÁLISE DA INFLUÊNCIA DAS AMOSTRAS DE REFERÊNCIA

Construíram-se 60 matrizes de confusão (Anexo IV), com as quais se calcularam os 60 valores de exactidão global e a partir destes se estimaram as respectivas médias e desvio-padrão (Tabela 11).

Tabela 11 – Valores de exactidão global (%) entre todos os mapas e todas as amostras de referência Mapas Amostras teste CMV Abril CMV Julho CMV 8bd CMV NDVI CMV CP CAD Abril CAD Julho CAD 8bd CAD NDVI CAD CP Média (%) Desvio Padrão (%) CMV 8bd 26 32 30 37 38 24 26 32 33 24 30 4.99 CMV ndvi 25 31 30 28 33 25 30 28 30 24 28 3.09 CMV cp 35 38 43 43 36 27 27 35 35 26 35 6.13 CAD 8bd 30 38 43 44 46 28 39 37 38 28 37 6.62 CAD ndvi 30 34 35 36 39 20 24 30 32 24 30 5.96 CAD cp 23 26 29 32 30 24 20 29 26 25 26 3.65 Media (%) 28 33 35 37 37 25 28 32 32 25 Desvio Padrão (%) 4,48 4,60 6,35 6,42 5,58 2,75 6,49 3,68 4,1 1,42 CMV - Classificador de Máxima

Verosimilhança CAD - Classificador de Arvores de Decisão

As linhas da tabela apresentam os valores de exactidão global de todos os mapas por cada amostra de referência, observando-se assim o desempenho do conjunto de classificações na amostra de referência considerada. As colunas mostram os valores da

56

exactidão global de cada mapa em cada amostra de referência, permitindo avaliar o efeito de cada uma das amostras de teste sobre os valores de exactidão global de cada um dos mapas produzidos pelos diferentes classificadores/conjunto de dados.

Analisando os valores de exactidão global por coluna, os valores das médias calculadas por mapa variam entre 25% (CAD/Abril e CAD/CP) e 37% (CMV/NDVI e CMV/CP). Os valores de desvio padrão indicam uma variação em torno da média entre 1,42 e 6,49%. Observa-se que as médias mais elevadas de exactidão global correspondem aos valores mais elevados de desvio-padrão (CMV/NDVI e CMV/CP). Por outro lado, os mapas que apresentam média mais baixa (CAD/Abril e CAD/CP) apresentam os valores mais baixos de desvio-padrão. Isto poderá indicar que o CAD é menos sensível às diferentes amostras de referência do que o CMV.

Os valores de desvio-padrão por mapa indicam variações de exactidão temática significativas que podem ultrapassar os 6%. Observando as amplitudes, por exemplo, do mapa CMV/Abril, verifica-se que a diferença entre o valore mínimo e o valor máximo de exactidão global é de 12%.

Os valores das exactidões globais mostram uma variação assinalável com as amostras de referência. Esta situação talvez se deva ao facto destas terem sido construídas com base numa amostragem aleatória, estratificada pelas classes dos mapas que lhe deram origem. Essa situação determina uma desigualdade na amostragem por cada classe dos outros mapas, podendo mesmo ocorrer classes que não sejam amostradas de todo, conforme se pode verificar nas matrizes de confusão (Anexo IV). Esta situação poderá ter gerado diferenças tais entre as amostras de referência, que terão levado às diferenças observadas.

Examinando os resultados da Tabela 11 por linha, observamos o desempenho de cada classificador/conjunto de dados por cada amostra de teste. Assim, é possível verificar se o ranking dos conjuntos classificador/conjunto de dados varia em cada amostra.

Analisando os valores de exactidão global dos mapas em cada amostra de teste, verifica-se que globalmente os mapas produzidos com o Classificador de Máxima Verosimilhança (CMV) obtiveram valores de exactidão global superiores aos do Classificador de Árvores de Decisão (CAD) - Figura 19.

57 0.00% 5.00% 10.00% 15.00% 20.00% 25.00% 30.00% 35.00% 40.00% 45.00% 50.00% CMV/Abril CMV/Julho CMV/Abril+Julho CMV/NDVI CMV/CP CAD/Abril CAD/ulho CAD/Abril+Julho CAD/NDVI CAD/CP

Figura 19 – Valores de exactidão global dos 10 mapas por cada uma das amostras de teste.

Verificando os resultados pelo conjunto de dados, através de uma comparação dos mapas resultantes da assinatura espectral da imagem de Abril e dos mapas produzidos com base na imagem de Julho, independentemente do classificador, estes últimos têm globalmente melhores resultados. Provavelmente a imagem de Julho discrimina melhor a ocupação do solo do que a dos dados provenientes da imagem de Abril.

Analisando os resultados do CAD, o conjunto de dados produzidos com base nas imagens de Abril e Julho mais o NDVI de Abril e Julho e o conjunto de dados composto por imagens de Abril e Julho, produziram, na maior parte das amostras de teste, os melhores resultados.

Relativamente ao CMV, os valores de exactidão global dos mapas criados pelos conjuntos de dados CP e NDVI são os que se destacam na maior parte das amostras de teste. Estes resultados indiciam que um aumento nos dados de input, acrescentando mais bandas (Abril+Julho), o índice de vegetação NDVI à informação espectral disponível, bem como o efeito da redução da redundância de dados na classificação recorrendo aos Componentes Principais (CP), pode melhorar a classificação.

58

Embora outros estudos indicam que os classificadores não-paramétricos possam produzir melhores resultados do que os paramétricos em paisagens complexas (Paola e Schowengerdt 1995, Foody 2002b in Lu e Weng, 2007). No caso específico do presente estudo, os resultados obtidos apontam que, com os dados utilizados, o Classificador de Máxima Verosimilhança tende a produzir melhores resultados na exactidão global do que o Classificador de Árvores de Decisão. Estes resultados são corroborados pelo estudo de Costa (2008), no qual, o desempenho do Classificador de Árvores de Decisão não superou o Classificador de Máxima Verosimilhança, no que concerne aos valores de exactidão global.

No estudo desenvolvido por Costa et al. (2009) obtiveram-se valores de exactidão temática total baixos, num teste em imagens AWiFS com os classificadores de Máxima Verosimilhança (CMV) e Árvores de Decisão (CAD). Segundo estes autores, nem o uso de três datas diferentes (primavera, verão e outono), nem o NDVI e nem as componentes principais melhoraram consideravelmente os resultados. Ainda de acordo com estes autores, isto mostra que apenas duas imagens AWIFS de primavera e verão são suficientes para classificar a paisagem de Portugal Continental.

Em suma, verifica-se que as amostras de referência parecem influenciar os valores da exactidão global dos mapas produzidos nos testes de classificação. Consequentemente, poderá pôr-se em causa a robustez da análise dos testes elaborados, que consistem na comparação de diferentes métodos de classificação, cuja avaliação da exactidão temática se baseia em amostras de referência específicas para cada mapa.

Por outro lado, os baixos valores de exactidão global podem ser explicados pela complexidade da paisagem e pela informação contida nas imagens AWiFS. Quanto às características da paisagem, conforme o que foi descrito no capítulo 2.1, o uso do solo com maior expressão espacial é o montado, que se traduz em áreas heterogéneas e com diferentes graus de misturas de ocupação do solo. Este uso apresenta um carácter híbrido em termos de utilização do solo e de transição entre as florestas fechadas e os campos agrícolas abertos, cujo sistema de maneio origina dinâmicas de ocupação do solo geralmente intra-anuais.

As unidades de paisagem indicam uma forte diferenciação entre o Norte e o Sul da área de estudo, pelo facto desta ser composta por duas unidades de paisagem que são de grupos de unidades diferentes, caracterizando uma área de planície e uma área

59

serrana. A estes contrastes paisagísticos junta-se a diversidade no interior de cada unidade de paisagem, justificada pela delimitação de três sub-unidades em cada uma delas. Por sua vez, a dimensão da área de estudo também condicionou o processo de classificação, em particular na construção da amostra de treino, no sentido em que limita a procura de unidades amostrais.

Relativamente às características das imagens AWiFS, outros estudos mostram que estas imagens não fornecem informação espectral suficiente para uma classificação ao nível do pixel (Costa, 2008 e Costa et al., 2008). Segundo Costa et al. (2008), os resultados obtidos num estudo comparativo do desempenho de classificações entre imagens AWiFS e MERIS, demonstraram que os menores valores de exactidão obtidos na classificação de imagens AWiFS podem ser explicados pela sua menor resolução espectral. Segundo esse estudo, a informação espectral desempenha um papel mais decisivo do que a informação temporal na melhoria da exactidão temática. Pelo contrário, a resolução espacial não influencia a exactidão temática da cartografia quando esta é derivada a partir de bases de dados construídas especificamente para as imagens a classificar. A sua influência é principalmente sentida no que respeita ao treino da classificação assistida, para o qual é necessário um maior esforço de amostragem à medida que a resolução espacial aumenta.

Relativamente à informação temporal, o uso de apenas duas datas em detrimento da rejeição da imagem de Outubro, por este conter uma área elevada de cobertura nebulosa, não é determinante para os desempenhos da classificação. De facto, as imagens de primavera, verão e outono foram seleccionadas com o objectivo de adquirir as maiores diferenças espectrais que as classes apresentam ao longo do ano. O objectivo seria recolher a informação espectral associada às das dinâmicas de ocupação do solo de algumas classes, tentando assim aumentar a capacidade de descriminação e melhorar a classificação. No entanto, em Costa (2008), num estudo com imagens AWiFS de Abril, Julho e Outubro, a imagem de Outubro não melhorou significativamente os resultados da exactidão global.

60

5C

ONCLUSÕES

A exactidão global dos mapas produzidos com diferentes abordagens de classificação automática, com base nas imagens AWiFS, foi muito baixa. A metodologia de trabalho assentou num grande esforço de amostragem de treino e de teste e apoiou-se no conhecimento da área de estudo e familiarização com os dados auxiliares, bem como o recurso a identificação no campo. Estes factos reduzem as probabilidades de erro metodológico ao nível da subjectividade inerente aos processos de interpretação visual de imagem, nos processos de construção da amostra de treino e das amostras de referência.

A metodologia utilizada neste trabalho é semelhante a de outros estudos que demonstraram que esta não influencia negativamente os desempenhos dos classificadores. Estes factos reforçam a ideia de que, no presente estudo, os resultados dos valores de exactidão global, devem-se às características dos dados.

As características das imagens AWiFS e da área de estudo são os factores que explicam os baixos valores de exactidão global das classificações. No processo de classificação, a complexidade da paisagem associada à resolução espectral das imagens AWiFS, contribuíram para os valores de exactidão global obtidos em todas as abordagens de classificação.

De facto, estes dois factores contribuem fortemente para a heterogeneidade do

pixel, elevando a probabilidade da reflectância deste ser resultante das misturas de

várias classes de ocupação do solo. Durante o processo de classificação, em particular nas fases de definição da nomenclatura e na construção das amostras de treino e de teste, verificou-se com evidência a complexidade da paisagem e da ocupação do solo da área de estudo. Na região do Baixo Alentejo, onde se localiza maioritariamente a área de estudo, os resultados e a análise do processo de classificação apontam que estas paisagens são difíceis de classificar por métodos automáticos com imagens AWiFS.

Relativamente às características das imagens AWiFS, outros estudos comprovam que a sua resolução espectral é um factor condicionante na classificação das mesmas. Estes demonstram que em condições semelhantes, as de imagens de menor

61

resolução espacial mas de resolução espectral superior obtêm melhores desempenhos na classificação.

Aos dois factores acima descritos acrescenta-se um outro, este é a dimensão da área de estudo. Este factor condicionou fortemente a construção da amostra de treino, não permitindo uma selecção mais alargada de unidades amostrais por classe. É provável que esta situação tenha tido influência na representatividade das amostras por cada classe de ocupação considerada.

O recurso a amostras de teste específicas para cada mapa na sua avaliação da exactidão temática, não permitiu a comparação dos resultados entre os diferentes mapas. Isto sucede porque a avaliação da exactidão temática, baseou-se em amostras de referência estratificados por classe, específicos para cada mapa. Consequente, existirão classes com um número insuficiente ou mesmo inexistente de unidades amostrais, o que influencia fortemente os índices específicos de exactidão das classes de ocupação do solo. Este trabalho revela, face aos dados utilizados, que as amostras de referência poderão ter influenciado significativamente os valores de exactidão temática dos mapas.

Para poder realizar este tipo de análise, deverá ser feita uma amostragem aleatória, estratificada sobre um mapa de referência. As unidades amostrais resultantes desse mapa de referência seriam comuns no processo de avaliação da exactidão temática de todos os mapas. O mapa de referência deverá ter características semelhantes aos mapas dos testes, principalmente no que toca à nomenclatura das classes de ocupação do solo e a unidade mínima cartográfica.

No entanto, através das amostras de teste foi possível avaliar o desempenho entre as diferentes abordagens de classificação (classificador/ conjunto de dados), onde os resultados obtidos determinam que o Classificador de Máxima Verosimilhança (CMV) supera o Classificador de Árvores de Decisão (CAD) quanto à exactidão global dos mapas. Por outro lado, observou-se que os conjuntos de dados que mais beneficiaram as classificações com CMV foram aqueles constituídos por imagens de Abril e Julho com dados de NDVI de Abril e Julho e os dados resultantes da Análise de Componentes Principais (ACP) de Abril e Julho. Quanto ao CAD os conjuntos de dados que mais favoreceram os resultados foram os conjuntos constituídos por imagens de