O software IraMuTeQ (Interface R para Análises de Textos Multidimensionais e Questionários) foi utilizado neste trabalho na versão 0.7 alpha 2. Este software funciona nos sistemas operacionais Linux, Macintosh e Windows, sua distribuição é gratuita estando disponível para download na página do software. 58
O IraMuTeQ é baseado na linguagem R e na linguagem 59 python . Loubère, Ratinaud60 (2014, p. 3, tradução nossa) afirmam que o software “oferece um conjunto de tratamentos e ferramentas para ajudar na descrição e análise de corpus textuais e matrizes de tipos pessoas/personagens”, sendo possível ser utilizado como uma ferramenta auxiliar na análise
58 - O software está disponível para download no site <http://www.iramuteq.org/>. 59 - Para saber mais sobre a linguagem R, basta acessar <www.r-project.org>. 60 - Para saber mais sobre a linguagem python, basta acessar <www.python.org>.
82
de documentos de textos e quadros.
Dentre as diversas análises que o software faz, adotou-se a análise de Classificação Hierárquica Descendente (CHD). No entanto, para explicar melhor esta análise, é necessário formalizar alguns conceitos:
❖ Corpus: é o conjunto de todas as respostas organizadas de forma separada em um único documento;
❖ Texto: é considerado o texto de cada uma das respostas presentes no corpus, ou seja, o corpus é o conjunto dos textos;
❖ Segmento de texto (ST): são fragmentos dos textos recortados que geralmente tem em média três (3) linhas (CAMARGO e JUSTO, 2013);
❖ Ocorrências: é a quantidade de palavras do todo que o software considerou em uma análise;
❖ Número de formas: é o número de palavras sem repetição, considerando-se como o vocabulário da análise;
❖ Hapax: segundo Salviati (2017, p. 13), “[...] é uma palavra que aparece registrada somente uma vez em um dado idioma. No IraMuTeQ, esta expressão designa uma palavra que se utilizou ou registrou apenas uma vez em um corpus”;
❖ Lematização: segundo Salviati (2017. p. 13), “[...] é o processo, efetivamente, de flexionar uma palavra para determinar o seu lema (as flexões chamam-se lexemas)”; ❖ Classes: considera-se como uma classe um grupo representativo da amostra que tem
respostas em comum, estas classes serão consideradas como “subcategorias”;
❖ Frequência: é a frequência que as palavras aparecem, considerando-se como uma taxa de corte, 15%;
❖ x²: (lê-se qui-quadrado) é o teste estatístico realizado pelo software IraMuTeQ que mostra o quanto as palavras estão relacionadas e imbricadas. Considera, como taxa de corte, valores menores que 3,84, pois este é um valor tabelado considerado como o valor crítico do x², ou seja, para valores maiores que 3,84 os resultados são significativos (CONTI, 2009, p. 2).
Relembrando que cento e setenta e um (171) professores foram os sujeitos integrantes da amostra. O quadro 4 mostra a distribuição destes, quanto a utilização ou não utilização da Gamificação no ensino de Matemática, bem como as técnicas de análise empregadas.
83
Quadro 4. Relação entre o quantitativo de professores que utilizou ou não a Gamificação e o método empregado na análise.
Fonte: Elaborado pelo autor (2019)
Para as questões abertas do questionário, optou-se inicialmente pela análise de cada uma delas, de forma separada, criando subcategorias, pois, segundo Salviati (2017, p. 11), “caso as questões referiram-se a temas ou aspectos diferentes, é necessário realizar uma análise para cada questão, caso contrário, a análise resulta apenas na identificação dos diversos temas [...]”, o que possibilita resultados mais precisos.
Camargo e Justo (2013, p. 3) destacam que “o corpus adequado à análise do tipo Classificação Hierárquica Descendente – CHD, realizada pelo software IraMuTeQ precisa constituir-se num conjunto textual centrado em um tema”, o que justifica a utilização da análise de questão por questão com a análise da CHD. Segundo esta análise, Salviati (2017), declara:
[...] visa obter classes de segmentos de texto (ST) que, ao mesmo tempo, apresentam vocabulário semelhante entre si e vocabulário diferente das ST das outras classes. Esta análise é baseada na proximidade léxica e na ideia que palavras usadas em contexto similar estão associadas ao mesmo mundo léxico e são parte de mundos mentais específicos ou sistemas de representação. Nessa análise, os segmentos de texto são classificados de acordo com seu respectivo vocabulário e o conjunto de termos é particionado de acordo com a frequência das raízes das palavras. O sistema procura obter classes formadas por palavras que são significantemente associadas com aquela classe (SALVIATI, 2017, p. 47).
A análise da CHD origina classes que agrupam as palavras do corpus textual conforme os valores do teste qui-quadrado, e permite ao pesquisador construir as subcategorias (classes) para análise.
Para que seja possível a realização da análise da CHD, é necessário construir um corpus textual contendo as respostas dos sujeitos da pesquisa para as questões propostas.
84
Camargo e Justo (2013) destacam orientações para que seja elaborado este corpus,que são as seguintes:
Ocorpus pode ser construído no editor de texto LibreOffice (ou no Word, em alguns 61 casos) utilizando a codificação Unicode UTF – 8. Nos dados coletados no questionário respondido pelos professores, observa-se que:
❖ Cada pergunta aberta gerou um conjunto de respostas, sendo esse conjunto o corpus do trabalho. No documento do LibreOffice cada uma dessas respostas fica em uma linha, sendo chamada de linha de comando, ou seja, é o comando que o software precisa ler para entender o que está naquela linha;
❖ Para a construção de uma linha de comando segue-se a ordem da figura 12:
Figura 12. Linha de comando para construção do corpus de trabalho.
Fonte: Elaborado pelo autor com base nos tutoriais do software IraMuTeQ de Camargo e Justos (2013)
❖ Após a elaboração de todas as linhas de comando e da organização de cada uma das respostas devidamente em seu lugar, é necessário fazer a correção ortográfica, sintática e revisar todas as questões verificando erros de digitação, além de complementação das frases para que se tenha sentido, e/ou, eliminação de frases sem sentido;
❖ Não se deve deixar parágrafos ou linhas avulsas. Também, o texto não deve conter nenhuma formatação (negrito, itálico, sublinhado, espaçamentos, parágrafos, etc.). Deve-se excluir as pontuações como aspas ("), cifrão ($), apóstrofo ('), porcentagem (%) hífen (-), e asterisco (*), exceto para as linhas de comando.
Finalizando a construção do corpus textual, ele pode ser inserido no software IraMuTeQ, gerando vários relatórios, dentre eles a CHD. Na próxima seção, apresenta-se as
85
técnicas de Análise de Conteúdo de Bardin (2016), bem como considerações de como elas foram utilizadas na análise dos dados desta dissertação.