RELEASE II USER'S GUIDE - IUP NUMBER 5796-AAT
PHYSICAL PLANNING TEMPLATE, SYSTEM/370 MODEL 195 IBM SYSTEM/370 MODEL 165 OPERATORS REFERENCE CARD
Segundo Souza e Di-Felippo (2018), “Aprendizado de Máquina é uma área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais para o aprendizado bem como a construção de sistemas (ou algoritmos) capazes de adquirir conhecimento de forma automática a partir de exemplos”. De acordo com Marsland (2009), Aprendizado de Máquina é “fazer com que computadores modifiquem ou adaptem as suas ações (...) de forma que elas se tornem mais precisas, e essa precisão é medida com base em quão bem as ações escolhidas
refletem as ações corretas” (p. 5 – tradução nossa)24. Logo, a ideia contida no AM é a de que, a partir de um treinamento, o computador (mais precisamente, os algoritmos de AM) possa “aprender” uma tarefa: a máquina seria capaz de, a partir de um conjunto de dados de entrada, “aprimorar a si mesma no desempenho de sua tarefa” (FERREIRA; LOPES, 2017, p. 204).
Há mais de uma possibilidade de execução de AM: Supervisionado, Não Supervisionado e por Reforço. No primeiro, que é o que interessa aos fins desta pesquisa, oferece-se ao algoritmo um conjunto de entradas com informações (os atributos) e exemplos de saídas esperadas, que servirá para que o algoritmo aprenda a correspondência entre atributos da entrada e as respectivas saídas. Em outras palavras, a partir de uma entrada e de uma saída conhecidas, o algoritmo deve ser capaz de aprender a tarefa com tal precisão que consiga prever a saída desconhecida de uma entrada totalmente nova. No Aprendizado Não Supervisionado, não se fornece nenhum tipo de informação sobre a saída esperada, apenas sobre as entradas, e o algoritmo precisa encontrar sozinho regularidades nos dados de entrada. O Aprendizado por Reforço é estabelecido de forma que haja interação e feedback conforme o desenvolvimento da tarefa, “premiando” saídas corretas e “punindo as incorretas” (MARSLAND, 2009). A tarefa desta pesquisa consistirá em AM Supervisionado, pois interessa correlacionar atributos identificados por análises linguísticas com a presença de desvios sintáticos. Além disso, pretende-se identificar e analisar os atributos mais relevantes para as decisões tomadas pelos algoritmos, o que só é possível no Aprendizado Supervisionado. Assim, esse tipo será o foco desta seção e, a partir daqui, todas as menções a AM se referem a ele.
Uma das questões primordiais do processo de AM consiste na seleção dos atributos (em inglês, features) relevantes a partir dos quais o algoritmo aprenderá. Tais atributos são os dados de entrada do algoritmo (FERREIRA; LOPES, 2017). Assim, em uma tarefa de classificação, a partir da inserção de um conjunto de exemplos de treinamento (por exemplo, o corpus) com os respectivos atributos, e da classe desses exemplos (a classificação pretendida, resultante do processo de anotação do corpus), que deve ser conhecida para o treinamento, o algoritmo deve ser capaz de aprender as relações existentes entre atributos e classe (SOUZA; DI-FELIPPO, 2018). O processo no qual o algoritmo de AM acessa os dados conhecidos para aprender uma tarefa é chamado de treinamento do modelo (FERREIRA; LOPES, 2017), e a parcela do corpus utilizada para essa tarefa é chamada de corpus de treinamento.
Os resultados obtidos com essa técnica dependem em grande medida da tarefa e do algoritmo de AM selecionado. Em termos de tarefa, há dois tipos de problemas: regressão e
24 “Machine Learning, then, is about making computers modify or adapt their actions (…) so that these actions get
classificação. A tarefa proposta neste estudo consiste em um problema de classificação. Entre as possibilidades de algoritmos, há três paradigmas nos quais eles costumam ser classificados: simbólico, conexionista e matemático (ou probabilístico). Em geral, os algoritmos simbólicos são facilmente interpretáveis, uma vez que “descrevem os padrões aprendidos em uma linguagem de fácil compreensão para humanos” (SOUZA; DI-FELIPPO, 2018, p. 143). Como exemplos de algoritmos de cada um dos paradigmas, citam-se: (i) no paradigma conexionista, as redes neurais, (ii) no paradigma matemático, os algoritmos Naïve Bayes e Support Vector Machines e, (iii) no paradigma simbólico, as árvores de decisão. A evolução do AM tem sido intensa nos últimos anos, com o surgimento do aprendizado profundo (deep learning) e as possibilidades utilizando redes neurais. Não cabe aqui uma discussão ou apresentação detalhada desses conceitos, uma vez que a pesquisa pretende utilizar apenas os algoritmos que permitem uma interpretação facilitada por pessoas sem formação em computação. O AM, para este estudo, servirá como uma ferramenta com o potencial de explicitar correlações de forma mais ágil do que as análises manuais.
Nesse sentido, há diversas possibilidades de execução de tarefas de AM, tanto por meio de scripts, utilizando bibliotecas específicas para as linguagens de programação, quanto por meio de softwares com interfaces gráficas que unem diversos algoritmos. Um deles é o Weka (Waikato Environment for Knowledge Analysis)25, um software de código aberto desenvolvido
pela Universidade de Waikato, na Nova Zelândia (HOLMES; DONKIN; WITTEN, 1994). Ele agrega diversos algoritmos de AM de diferentes paradigmas para mineração de dados, em uma interface gráfica amigável e de utilização fácil por usuários sem experiência em Computação. Em função dessas facilidades e da disponibilidade livre do software, optou-se pela sua utilização na etapa de AM desta pesquisa.
Outro aspecto que merece especial atenção em tarefas de AM é a avaliação, isto é, a confirmação de que o algoritmo realmente aprendeu a realizar determinada operação, e não está simplesmente gerando resultados aleatórios. Para isso, faz-se necessário um corpus de teste, composto por um conjunto de elementos anotados, mas cujas anotações não são disponibilizadas ao algoritmo durante a fase de treinamento (FERREIRA; LOPES, 2017). Assim, como dito anteriormente, a partir dos dados fornecidos no treinamento, o algoritmo deve ser capaz de classificar elementos novos da forma mais correta possível. Logo, é fundamental que o corpus de teste seja selecionado antes do treinamento do algoritmo. Ignorar essa etapa
25 Sabe-se que as técnicas de AM evoluem muito rapidamente, e há diversas ferramentas com resultados melhores
do que a que foi escolhida. Porém, escolheu-se um percurso mais facilmente executável e interpretável por pessoas sem formação em disciplinas ligadas à Ciência da Computação.
provavelmente gerará resultados muito bons na avaliação, mas esses resultados são enganosos, pois não indicam o desempenho real do algoritmo frente a dados para os quais ele não foi treinado.
Para medir os resultados do AM, há uma série de métricas disponíveis, mas três delas merecem destaque: a precisão (em inglês, precision), a cobertura (em inglês, recall) e a medida- f (em inglês, f-measure) (MITCHELL, 1997). A precisão consiste no número de ocorrências em que o algoritmo acertou a classificação em relação ao número total de ocorrências. A cobertura indica o número de ocorrências classificadas corretamente em relação às ocorrências que deveriam ter sido identificadas. A medida-f é a média harmônica entre as anteriores. Em geral, conforme a cobertura aumenta, a tendência da precisão é diminuir, mas o ideal é atingir o equilíbrio, com resultados satisfatórios nas três métricas (FERREIRA; LOPES, 2017).
Por fim, ressalta-se que, ainda que se faça uma descrição de fenômenos linguísticos, esta pesquisa se insere na área do PLN porque faz uso de ferramentas de PLN (como POS tagger e parser) e porque busca fornecer subsídios para o desenvolvimento de tais ferramentas. Além disso, utilizam-se técnicas de AM para explicitar, em um conjunto de dados relativamente grande, possíveis correlações entre os atributos encontrados nas análises manuais e a presença ou ausência de desvios sintáticos. No próximo capítulo, apresentam-se alguns dos estudos anteriores que se relacionam mais diretamente com o objeto de estudo desta pesquisa.
3 TRABALHOS RELACIONADOS
Este capítulo traz estudos e pesquisas que antecederam este trabalho, especialmente no que diz respeito à análise de aspectos linguísticos em corpora de redações escritas por estudantes em formação e ao interesse da área de PLN nas tarefas de identificação, classificação, avaliação e correção automática ou semiautomática de redações. Inicia-se com os estudos que analisam redações do ponto de vista linguístico, trazendo na sequência aqueles voltados ao desenvolvimento de sistemas de PLN.