Chapter 10 Extensibility through POSTSCRIPT Language Files
C. I. Operator Omissions and Limitations
C.5. Other Differences with the POSTSCRIPT Language
8.7. pathtype
Esta é uma grande área de pesquisa que conta com muitas ferramentas e métodos matemáticos para soluções dos problemas de reconhecimento de padrões. Uma destas ferramentas são as técnicas de inteligência artificial, predominantemente as redes neurais. O entendimento básico do problema de reconhecimento de padrões ajudará a compreender a que se propõem as redes neurais artificiais.
Para determinar o que seja o problema de reconhecimento de padrões pode-se considerar uma tarefa que é extremamente básica para a maioria dos seres humanos: ler. A parte mais significante das informações que o ser humano absorve é lhe apresentada em símbolos padronizados. O texto que você está lendo agora é apresentado em formas de padrões complexos e variados. Antes de se considerar as questões cognitivas relativas ao processamento da linguagem, o sistema visual deve primeiro resolver o problema do
reconhecimento de padrões. Isto é, reconhecer as cadeias de símbolos como caracteres alfabéticos.
O fato de que o sistema visual resolve esta questão quase sem esforço, faz com que não se considere devidamente a complexidade desta imensa tarefa. Entretanto, se esta tarefa for apresentada a um computador, logo vê-se a enorme dificuldade de se implementar uma solução efetiva para este problema. Uma solução computacional para este problema seria utilizar a técnica de casamento de medidas.
Nesta técnica cada letra é armazenada numa estrutura matricial fixa e então estes padrões armazenados são um a um comparados com o símbolo que se quer descobrir. Esta é a solução usada em aplicações simples, por exemplo numa linha de produção de uma fábrica, onde é fácil armazenar todas as possíveis formas e tamanhos dos produtos de uma linha de montagem. Considere entretanto o que aconteceria com a técnica de casamento de medidas se em um texto fossem encontradas letras com tamanhos diferentes daquele que foi armazenado numa estrutura matricial fixa. A menos que se tivesse uma segunda estrutura, do tamanho correto, o desempenho do sistema seria, para esta tarefa de classificação, extremamente miserável.
Considere então a implementação de um sistema computacional que reconheça textos manuscritos. Seria praticamente inviável o armazenamento de muitas estruturas matriciais fixas correspondendo aos vários tamanhos de textos manuscritos encontráveis.
O processamento de textos é apenas um dos exemplos dos problemas que as técnicas de reconhecimento de padrões tem como objetivo resolver. As dificuldades descritas acima se tornam mais complicadas se forem considerados o processamento de imagens, o reconhecimento da fala e a previsão das tendências do mercado financeiro.
DEFINIÇÕES
O objetivo fundamental no reconhecimento de padrões é a classificação. Dado um vetor cujos elementos representam medidas de um determinado objeto, o sistema
classificador deveria dar como saída a indicação da classe a que pertence aquele objeto. Os classificadores convencionais comumente se utilizam das técnicas de "distâncias métricas" e da teoria da probabilidade.
A classificação é raramente executada utilizando-se somente uma simples medida, ou característica, do padrão de entrada. Usualmente muitas medidas são necessárias para que os padrões possam ser adequadamente distinguidos, ou categorizados. Sendo feitas n medidas em um objeto (que se deseja classificar), e sendo cada uma destas medidas uma característica única, então pode ser criado um vetor de características de dimensão n, que será a entrada do classificador. Este vetor visualizado num espaço de dimensão n, determina o que se chama o espaço de características.
A maneira mais simples de demonstrar o que seja o espaço de características é considerar um problema de duas dimensões. Ou seja, serão consideradas apenas duas medidas em relação aos objetos que se quer classificar. O problema será distinguir entre dois grupos profissionais aquelas pessoas que pertencem ao grupo dos dançarinos de ballet e as que pertencem ao grupo de jogadores de futebol. As duas medidas que serão tomadas serão o peso e a altura. Depois de feitas as medidas o espaço de características fica como na Figura 2.1.
TÉCNICAS DE CLASSIFICAÇÃO
As técnicas de reconhecimento de padrões podem ser divididas em dois grandes grupos: os numéricos e os não numéricos. As técnicas numéricas incluem medidas estatísticas e determinísticas. As técnicas não numéricas são aquelas que levam a termo o processamento simbólico e métodos tais como a lógica fuzzy.
Uma das técnicas numéricas de reconhecimento de padrões muito utilizada é conhecida como k-Vizinhos mais Próximos (k-Nearest Neighbour - kNN). Esta é uma das técnicas de classificação cujo desempenho é geralmente comparado às redes neurais artificiais.
A técnica dos k-Vizinhos mais Próximos (k-Nearest Neighbour - kNN) toma a decisão de classificação baseada nas classes a que pertencem os k exemplos mais próximos do padrão de teste. A decisão define que o padrão de teste de entrada pertence à classe que possui mais exemplos entre os k primeiros que têm menor distância a ele (Beale and Jackson, 1990).
Considerando por exemplo, duas classes representadas no espaço de características e que se quer classificar um padrão de entrada X, ou seja, descobrir a que classe ele pertence, a técnica dos k-Vizinhos mais Próximos toma uma decisão baseada na menor distância. A pergunta que precisa ser respondida é a seguinte: o padrão que se quer classificar (X) está mais próximo a que padrão ? A classe a qual pertencer o padrão mais próximo de X será então a resposta do classificador. Pela Figura 2.2 vê-se que o padrão X pertence à Classe 2.
Figura 2.2 – 1a classificação do kNN.
Considerando a nova situação apresentada pela Figura 2.3 se for considerado apenas o primeiro vizinho mais próximo o padrão X seria classificado como pertencente à classe 2, o que seria um erro, pois claramente, na Figura 2.3 o padrão X pertence à classe 1. Mas se for considerado talvez o cinco vizinhos mais próximos, entre estes cinco teríamos 4 deles pertencentes à classe 1, o que faria com que o padrão X fosse classificado corretamente como pertencente à classe 1.
Figura 2.3 – 2a classificação do kNN.