Conclusion du chapitre - Structure du chapitre

Structure du chapitre

5 Conclusion du chapitre

A mesma palavra pode ter diferentes significados em diferentes contextos. Vamos considerar o exemplo de bateria. Esta palavra pode significar um instrumento mu- sical, um artefacto de guerra, ou uma pilha eléctrica. A tarefa de desambigua¸cão de acep¸cão de palavra consiste em decidir segundo o contexto, qual dos significados é expresso pelo lexema.

Também esta tarefa se assemelha ao nosso problema. Podemos encarar a sequência de lema e tra¸cos verbais como “a acep¸cão da palavra” relativa à ocorrência de um verbo num dado contexto.

Na desambigua¸cão da acep¸cão de palavra, o conjunto de classes que se pode atribuir não é fechado, tal como no nosso caso. Uma palavra pode ter inúmeros significados. Embora se saiba pelas entradas no dicionário qual o número máximo de significados de cada uma das palavras, esse número não é inalterável pois novos significados e novas palavras podem surgir.

2.5.2 Abordagens populares

A tarefa de desambigua¸cão da acep¸cão de palavra tem aspectos comuns com a tarefa de etiqueta¸cão. A diferen¸ca reside nas regras a combinar com os métodos usados para os adaptar ao problema. Por exemplo, no problema de etiqueta¸cão podem-se juntar regras que eliminem à partida algumas combina¸cões de sequências de classes gramaticais que não são poss´ıveis, ou no problema de desambigua¸cão da acep¸cão de palavra uma consulta a uma ontologia, como a WordNet,21

pode permitir relacionar as palavras do contexto e a palavra a ser desambiguada com uma medida de “distância semântica” entre os nós das entradas correspondentes ás palavras na ontologia.

Tal como na tarefa de etiqueta¸cão, os métodos com melhores resultados são os métodos supervisionados de aprendizagem automática. De entre estes sobressaem alguns algoritmos que costumam ter os melhores desempenhos para a desambigua¸cão de acep¸cão de palavra (Agirre e Edmonds, 2006).

O classiﬁcador Na¨ıve Bayes baseia-se no Teorema de Bayes assumindo in- dependˆencia entre os atributos.22

O Teorema de Bayes consiste em relacionar a probabilidade condicional e marginal de dois eventos aleatórios. Supondo dois eventos A e B, a rela¸cão é expressa pela fórmula

P (A|B) = P (B |A)P (A) P (B )

http://wordnet.princeton.edu/

onde P(A) é a probabilidade marginal de A, sem conhecimento prévio de B. P(A|B ) é a probabilidade condicional de A dado o evento B. P(B |A) é a probabilidade de B dado A. P(B ) é a probabilidade marginal de B e funciona como constante de normaliza¸cão.

O classificador dos k -vizinhos mais próximos consiste em guardar exemplos de treino, depois os novos exemplos são classificados de acordo com os k -vizinhos mais próximos segundo uma métrica de distância préviamente escolhida, tipicamente a distancia de Hamming.

O classificador Listas de Decisão consiste em criar regras do tipo (condi¸cão, classe, peso). Os exemplos de treino servem para definir o peso de se classificar um novo exemplo dada a ocorrência de uma certa condi¸cão. A lista é ordenada por ordem decrescente dos pesos. Para classificar novos exemplos, a lista é percorrida até se encontrar o peso mais alto que coincide com o novo exemplo.

Outro classificador é o AdaBoost, que consiste em combinar classificadores mais fracos, moderadamente precisos, para se obter um classificador com alta precisão.

O algoritmo de Support Vector Machines (SVM) baseia-se no princ´ıpio de Minimiza¸cão do Risco Estrutural da teoria de aprendizagem estat´ıstica (Vapnik, 1998). De uma forma geral os algoritmos de SVM aprendem uma discriminante lin- ear que separa os exemplos negativos dos exemplos positivos com margem máxima. Segundo (Agirre e Edmonds, 2006), o algoritmo SVM é o que tem melhores resultados, sendo que o AdaBoost melhora quando o número de exemplos por classe aumenta, embora a diferen¸ca não aumente significativamente. Todos os algoritmos estudados neste livro são executados sobre as mesmas condi¸cões de teste.

Segundo Pederson e Mihalcea (2005), que analisa vários testes feitos em diversos trabalhos, indica por sua vez que em geral o Na¨ıve Bayes obtém melhores resultados ou ao n´ıvel do estado da arte. O mesmo é testado por vários autores como é dito em (Pederson e Mihalcea, 2005, página 90).

Assim, dado que a abordagem ao problema que nos interessa como tarefa de etiqueta¸cão já foi explorada sem se conseguir ultrapassar os resultados do valor base de compara¸cão,23

para além de não abranger a totalidade do problema, vamos apostar em explorar uma abordagem de tipo desambigua¸cão da acep¸cão da palavra, focando os algoritmos que em princ´ıpio terão melhores resultados, Na¨ıve Bayes e SVM.

Abordagem explicada no ponto ponto 3.2. Algoritmo de máxima verosimilhan¸ca é tido como a base de compara¸cão do problema.

Cap´ıtulo 3

Estado-da-arte

Neste cap´ıtulo vou descrever os resultados que foram alcan¸cados até agora no que diz respeito à tarefa de desambigua¸cão de flexão verbal em contexto e que se encontram publicados na literatura relevante.

Vou come¸car por descrever como costuma ser feita a avalia¸cão neste tipo de prob- lemas e apresentar a caracteriza¸cão do léxico, depois apresentarei a caracteriza¸cão do corpus usado na avalia¸cão, o que dará uma ideia de como a ambiguidade do léxico se traduz num exemplo concreto.

Em seguida apresentarei algoritmos já explorados para este problema ou proble- mas semelhantes, come¸cando pelo algoritmo que define o valor base (Heur´ıstica de máxima verosimilhan¸ca) passando depois a outros.

3.1 Avalia¸c˜ao e conjunto de dados

Para se aplicar métodos estat´ısticos, torna-se necessário um conjunto de dados de treino, conhecido como corpus de treino. Este corpus pode encontrar-se anotado com etiquetas que veiculam informa¸cão lingu´ıstica associada às expressões que ocor- rem no texto (suportando aprendizagem automática supervisionada) ou não anotado (suportando aprendizagem automática não supervisionada). Tipicamente, a aprendizagem supervisionada leva a resultados superiores aos que se obtêm com aprendizagem não supervisionada, quer se encare a desambigua¸cão verbal como uma tarefa de etiqueta¸cão (Silva, 2007, página 51), quer como uma tarefa de desambigua¸cão da acep¸cão de palavra (Agirre e Edmonds, 2006, página 14). Visto que dispomos de um corpus etiquetado1

vamos focar este trabalho em métodos supervisionados. O conjunto de dados de treino serve para o computador “aprender” a tarefa. Através do processamento dos exemplos no corpus de treino, são estimados parâmetros estat´ısticos relevantes que o computador usa para procurar classificar novos casos apresentados. Para se avaliar o desempenho deste procedimento de decisão au-

O corpus descrito no ponto 3.1.1

tomática, é preciso determinar se a classifica¸cão está correcta ou não. Isto pode ser conseguido se tivermos exemplos para testar que, em ocasião prévia, tenham sido correctamente anotados manualmente. Assim podemos comparar a anota¸cão correcta com a anota¸cão automática produzida pelo algoritmo de classifica¸cão.

Por conseguinte, é comum dividir-se o conjunto de dados anotados em corpus de treino e corpus de teste, usando-se maior quantidade de dados para o corpus de treino. Assim podemos obter uma medida de quão boa é a classifica¸cão automática. Em todos os resultados obtidos por mim ou obtidos previamente coloca-se a questão de o conjunto de dados utilizado ser ou não apropriado para a execu¸cão da tarefa e em que medida a existência de diferentes corpora para dom´ınios espec´ıficos poderia ajudar ou não esta tarefa.

Para o nosso caso, se todo o texto for, por exemplo, um discurso na primeira pessoa, dificilmente vamos conseguir classificar novos exemplos com boa taxa de acerto noutras pessoas verbais. No entanto, e aqui podem surgir resultados de avalia¸cão enganadores, se os exemplos de teste vêm do mesmo corpus vamos ter medidas de desempenho elevadas, apesar desse poss´ıvel enviesamento.

Dans le document Conception et évaluation de techniques d'interaction non-visuelle basées sur un dispositif personnel : application à l'exploration de cartes numériques par des personnes avec déficience visuelle (Page 30-76)