4. TERCERA GENERACIÓN: CONTEXTO Y ACCIÓN
4.1. TRADICIÓN EXPERIMENTAL: IMPLICACIONES EPISTÉMICAS
Para cada uma das ULs alvo definida nos termos do trabalho (aparar,
aparado, cortar, fatiar, ralar, ralado, recortar e serrar) foi feita a pesquisa pelo lema
nos dezesseis subcorpora. Os levantamentos obtidos foram na forma de
concordâncias (conforme figura abaixo) e estas geram subcorpora de lexemas (e.g.
como ‘aparar’ em “o jogador do Porto foi aparando as tímidas tentativas do time
adversário” versus; “os baldes não chegam para aparar a água que cai do teto e até
da instalação elétrica”) que participam de diferentes Unidades Lexicais. Como o foco
do trabalho são as ULs que evocam o frame de CORTE, foi necessário fazer a
classificação das sentenças. Assim, as concordâncias obtidas foram gravadas, sob
FrameNet Brasil - Corpus
Oral Didático Jurídico Literário Téc. & Cien. Jornalístico Univ ersitário Mensagem eletrônica
forma de tabelas, em arquivos do programa Microsoft Excel para que se fizesse a
posterior classificação das sentenças.
FIGURA 12: Pesquisa do lexema aparar – Corpus CONDIVport 5.0
As instâncias levantadas foram divididas em três grupos conforme a diversidade de
usos dos lexemas.
Grupo: A
Lexemas: Cortar, Recortar, Fatiar
Classificação:
1 – Sentido físico
2 – Sentido figurativo
3 – Usos como Adjetivo
4 – Usos como Substantivo
5 – Contexto insuficiente ou ambíguo
6 – Outros
Grupo: B
Lexemas: Ralar, Serrar, Aparar
Classificação:
1 – Sentido físico
2 – Sentido figurativo
3 – Usos como Adjetivo
4 – Usos como Substantivo
5 – Contexto insuficiente ou ambíguo
6 – Nome próprio
7 – Outros
Grupo: C
Lexemas: Aparado adjetivo, Ralado adjetivo
Classificação:
1 – Sentido físico
2 – Sentido figurativo
3 – Verbo
4 – Usos como Substantivo
5 – Contexto insuficiente ou ambíguo
6 – Nome próprio
7 – Outros
A tabela do Microsoft Excel relativa a cada UL é composta de duas
colunas: a primeira com as Sentenças e a segunda com a Classificação, feita
segundo as tipologias apresentadas.
Como exemplo, tomemos o caso do lexema aparar. Conforme nossa
classificação, esse lexema pertence ao grupo B. Assim, ao analisarmos suas
ocorrências, essas eram marcadas com a numeração relativa aos tipos previstos.
Para fins desse estudo, apenas foram consideradas as ocorrências marcadas com o
índice 1 (Sentido físico); as demais foram, portanto, desconsideradas. A figura 13
apresenta a tela com concordâncias do lexema aparar retiradas do corpus Chave
(Linguateca).
FIGURA 13: Arquivo do Microsoft Excel para classificação das sentenças
A primeira ocorrência da tabela foi classificada como 7 (outros), pois na
verdade não temos o lexema aparar; houve um erro de grafia na preposição para:
“Em seguida, volta apara o Quênia para treinar para o Capeonato Nacional de
Cross-Country, dia 1º. de fevereiro.
Na linha 3, temos o lexema aparar usado como adjetivo e recebeu, portanto, a
classficação 3:
“Apaixonados pelo calor tropical de Miami, os jogadores e a comissão técnica se
viram ameaçados depois do puxão de orelhas de Schaffel, um executivo de
barba bem aparada que deixou a fria New Jersey em 1986 resolvendo ganhar a
vida em Miami”
Na linha 5, temos uma ocorrência válida para este trabalho e que foi classificada
como 1 (sentido físico):
“As autoridades municipais de Koenigsberg apararam as árvores para que a
paisagem predileta do filósofo não fosse ocultada.
E na linha 6, temos um uso do lexema aparar em sentido figurativo, classificado
como 2:
“Começaram a testar antes, andaram fazendo voltas bem rápidas e tiveram
tempo de sobra para aparar as arestas de seus carros novos”.
Essa classificação foi feita com todos os lexemas em todos os corpora.
Foi necessário trabalharmos dessa maneira a fim de modelarmos os dados para o
tratamento a ser feito através do Programa R
20_ software para suporte à análise
estatística. Após classificação de todas as sentenças, cada um dos arquivos foi
submetido à análise do Programa R, conforme ilustração:
Figura 14: Rotinas do Programa R
Como resultado do processamento, é mostrada a quantidade de
ocorrências para cada um dos itens da classificação (sentido físico, figurativo,
adjetivo...) e os respectivos valores percentuais dessas ocorrências. Além disso, o
20 O R é uma linguagem e um ambiente para computação estatística e gráficos. Neste trabalho, este
software é usado simplesmente para gerar o subcorpus relevante a nosso trabalho. Mais informações disponíveis em:
Programa R gera um arquivo contendo somente as sentenças válidas para o
trabalho, ou seja, aquelas em que ocorre o lexema evocando o frame de CORTE em
sentido físico, ilustrando, portanto, a UL que queremos pesquisar. É a partir desse
arquivo que as análises e anotações descritas no Capítulo 4 foram processadas.
A Figura 15 mostra o arquivo gerado pelo Programar R com as sentenças
para análise, contendo a UL cortar em sentido físico.
Figura 15: Arquivo gerado pelo Programa R com as sentenças para análise
Quando as buscas para um lexema retornaram um número de
ocorrências superior a quatrocentas, essas foram submetidas a um sorteio através
do uso do Programa SPSS
21_ software de análise estatística. Foram submetidas ao
Programa SPSS os lexemas cortar, recortar e serrar. Depois de feito o sorteio, o
procedimento retorna ao anteriormente descrito: classificação das sentenças no
arquivo do Microsoft Excel e posterior passagem pelo Programa R. Após essa etapa
de trabalho, os dados estão prontos para análise e anotação.
21 O SPSS é um programa de análise estatística. Neste trabalho, ele é utilizado para realizar a
amostragem dos dados. Mais informações disponíveis em:
4- Anotação e Análise dos Dados
Com o objetivo de proceder às análises seguindo a Metodologia do
Projeto FrameNet americano, seguimos neste Capítulo os mesmos passos de
anotação prescritos pelo Projeto-Mãe e fizemos, quando foi necessário, acréscimos
cuja finalidade foi detalhar alguns procedimentos. Dessa forma, este apresenta o
seguinte percurso:
Inicialmente propusemos a definição do Frame de CORTE que
corresponde a uma tradução do frame do inglês, porém com exemplos coletados no
corpus de referência deste trabalho (seção 4.1). Na sequência (seção 4.2), foi feita
uma explanação introdutória sobre as Unidades Lexicais alvo da pesquisa, seguida
da anotação de todas as ocorrências coletadas para cada uma delas. No final das
anotações, foram apresentados quadros que correspondem a um resumo dos dados
coletados por UL. Como fecho do Capítulo, foram feitas considerações acerca das
evidências oriundas das anotações. Assim, temos na seção 4.3 um estudo sobre a
evocação de outras cenas; em 4.4 foi observada uma gradação entre cortar e serrar;
em 4.5 propusemos a intensidade do corte suscitada pelo uso da UL aparar versus
cortar e terminamos o Capítulo na seção 4.5 com uma abordagem sobre os EFs
centrais que figuram como Instanciações Nulas.
Conforme já citado, o presente estudo tem como foco a anotação
lexicográfica, nos moldes detalhados no capítulo anterior. O foco de análise da
anotação lexicográfica, nesses termos, recai sobre os elementos diretamente ligados
à UL alvo, desprezando-se, portanto, aqueles cuja localidade sintática esteja fora do
escopo de abrangência do alvo.
Ao elegermos para análise as ULs que evocam a cena de Corte, é
necessário iniciar a descrição pela identificação do referido frame, subtipo do
esquema mais amplo de eventos de ‘desconstituição de uma unidade física’.
O ato de se pensar o frame de Cutting para outra língua configura
também uma tarefa de análise dos equivalentes da sua tradução. Entretanto, nem
sempre a correspondência é direta em função de o trabalho com o léxico e suas
realizações sintáticas oferecer particularidades idiomáticas. Esta circunstância não
afeta negativamente o trabalho, apenas o enriquece. Além do mais, não foi feita
uma tradução literal do frame original do inglês até porque esta pesquisa não
consiste em apenas aplicar as soluções da FrameNet, mas manter um diálogo com o
projeto americano.
Dans le document
FILOSÓFICO DE LA CIENCIA
(Page 68-72)