5.3 Segmentation hi´erarchique interactive
5.3.3 Autre exemple d’utilisation
Para a realização da análise dos dados desta pesquisa, o primeiro passo foi a transcrição dos relatos concomitantes e o cálculo do tempo despendido pelos avaliadores para cumprirem a tarefa. Posteriormente, as transcrições dos relatos foram analisadas com o auxílio do software Concgram 1.0, para obter coocorrências de palavras (n-grams) mais frequentes no discurso dos avaliadores. No primeiro momento, foram gerados os n-grams para combinações de duas palavras. Os resultados obtidos mostraram combinações pouco produtivas para a identificação de tópicos recorrentes nas falas, por exemplo: ‘o que’, ‘que eu’, ‘que não’, ‘eu não’, ‘esse aqui’, dentre outros. Dado o grande número de ocorrências desse tipo, foram calculados então os n-grams encontrados para 3 e 4 palavras a fim de verificar combinações de palavras que evidenciassem mais sobre reflexões no discurso dos avaliadores que poderiam ser associadas aos métodos de avaliação. Todos os n-grams a partir de três palavras que pudessem ser selecionados como tópicos de reflexão dos sujeitos foram analisados com a ajuda da ferramenta de concordância do software Concgram 1.0 a fim de verificar-se sua pertinência para a extração de categorias potenciais de avaliação adotadas pelos avaliadores.
FIGURA 1 – Exemplo da tela do software Concgram 1.0 para concordâncias de ‘escolha lexical’
Após encontrar os n-grams e verificar com a ferramenta de concordância os contextos em que foram usados, agrupamos as ocorrências e estabelecemos categorias que representassem conjuntos de n-grams. As categorias às quais chegamos são ilustrados no quadro abaixo.
QUADRO 1
Categorias de avaliação e ocorrências de palavras encontradas nos relatos concomitantes
Exemplos de ocorrências encontradas no córpus Categoria estabelecida
eu acho, não acho, acho que, deve ser, imagino que (e também julgamentos de valor como “bom, ruim, feio, estranho, etc.”)
assertividade plena erro de digitação, ter um typo, erro de ortografia, problema de ortografia grafologia
não sei, não conheço, ter que checar, ter que conferir assertividade parcial inconsistência de uso, problema de uso, uso de plural, uso de singular,
tempo verbal, contável ou não contável
colocação / fraseologia escolhas de expressões, escolhas lexicais, expressões lexicais, escolha de
palavras, nome de instituição, tradução de nome, sem tradução
terminologia problema/erro de organização, problema/erro de estruturação,
problema/erro de construção
ordem dos constituintes da oração
trabalho científico, artigo científico, mais formal, menos formal, inglês padrão
aspectos contextuais eu sabia, não entendeu, conheço o tema, como conheço legibilidade / clareza
Posteriormente as categorias estabelecidas através da análise dos n-grams foram organizadas em três categorias maiores: i) relativas ao texto (original e traduzido), ii) relativas à execução da tarefa de avaliação e iii) relativas ao grau de assertividade do avaliador em relação ao seu julgamento. A organização dessas categorias pode ser observada na figura abaixo.
1. CATEGORIAS RELATIVAS AO TEXTO (ORIGINAL E TRADUZIDO) 1.1 ASPECTOS TEXTUAIS
1.1.1 LÉXICO-GRAMÁTICA
1.1.1.1 LÉXICO – TERMINOLOGIA
1.1.1.2 LÉXICO – COLOCAÇÃO / FRASEOLOGIA
1.1.2 GRAMÁTICA – ORDEM DOS CONSTITUINTES DA ORAÇÃO 1.1.3 GRAFOLOGIA (PONTUAÇÃO – ORTOGRAFIA)
1.2 ASPECTOS CONTEXTUAIS (GÊNERO E REGISTRO) 1.3 ASPECTOS RETÓRICOS
1.3.1 LEGIBILIDADE / CLAREZA
2. CATEGORIAS RELATIVAS À EXECUÇÃO DA TAREFA DE AVALIAÇÃO 2.1 USO DE APOIO INTERNO
2.2 USO DE APOIO EXTERNO
3. CATEGORIAS RELATIVAS AO GRAU DE ASSERTIVIDADE DO AVALIADOR EM RELAÇÃO A SEU JULGAMENTO
3.1 ASSERTIVIDADE PLENA 3.2 ASSERTIVIDADE PARCIAL
FIGURA 2 – Categorias extraídas do discurso dos avaliadores
cada avaliador às perguntas feitas pela pesquisadora ao final da tarefa a fim de mapear seu método de avaliação. Foi feita uma codificação dos relatos concomitantes com as categorias encontradas com a ajuda do Concgram 1.0, de acordo com os aspectos observados na fala dos avaliadores. Todas as falas foram analisadas e anotadas à medida que os tópicos abordados pelos sujeitos iam surgindo. Os rótulos foram marcados entre parênteses angulares (< >) para facilitar a contagem de cada rótulo feita posteriormente com o auxílio da ferramenta online
Word Frequency Counter (http://rainbow.arch.scriptmania.com/tools /word_counter.html).
Para a segunda etapa da análise de dados, que envolve o desempenho de cada sujeito na tarefa de tradução, foram agrupados os relatos de todos os avaliadores sobre cada sujeito, bem como as notas atribuídas a eles e suas classificações nos rankings, a fim de buscar uma avaliação geral para cada tradução. Após essa etapa, foram buscadas nos questionários prospectivos de cada um dos sujeitos explicações para seu desempenho.
Para a análise estatística dos dados, foram conduzidos testes U de Mann-Whitney com o auxílio do software SPSS 17. O teste de Mann-Whitney foi escolhido por ser a alternativa mais comum ao teste t para amostras independentes. Esse teste pode ser utilizado para testar a hipótese nula que afirma que as médias populacionais são as mesmas para dois grupos, sendo que esse teste não exige que as populações tenham a mesma variância. As hipóteses testadas via estatística foram: i) há diferença significativa na nota atribuída aos produtores de textos traduzidos tradutores profissionais e aos pesquisadores não tradutores; e ii) há diferença significativa na nota atribuída pelos avaliadores pesquisadores das Ciências Exatas, linguistas / linguistas aplicados e tradutores profissionais.
No Capítulo seguinte são apresentados os resultados da análise dos dados desta tese.
3 RESULTADOS DA ANÁLISE DOS DADOS
Neste Capítulo, são apresentados os resultados da análise de dados envolvendo 18 avaliadores, sendo seis de cada perfil profissional explicitado no capítulo de Metodologia. A primeira e a segunda partes da análise versarão sobre o perfil dos produtores dos textos traduzidos e dos avaliadores desta pesquisa, respectivamente. A terceira parte da análise de dados apresentará como os textos traduzidos foram avaliados e a quarta parte buscará definir o método de avaliação de cada avaliador.