A variação, conforme discussão estabelecida da seção 2.1, é sistemática e determinada por fatores condicionadores linguísticos e sociais. A atuação desses fatores sobre a variável dependente pode ser mensurada probabilisticamente, o que constitui o objetivo da análise estatística dos dados. Os resultados apresentados pela a análise estatística busca medir e avaliar isoladamente a interferência de um fator sobre uma ou outra variante, mesmo “[...] quando tal fator nunca se apresenta isoladamente nos dados [...]” (NARO, 2007, p. 17).
Para a realização deste estudo, foi utilizado, como ferramenta estatística, o programa de regra
variável GoldVarb, versão mais recente do programa Varbrul (SANKOFF, 1988; PINTZUK,
1988). Esse programa é constituído por “um conjunto de programas computacionais de análise multivariada, especificamente estruturado para acomodar dados de variação linguística” (GUY: ZILLES, 2007. p. 105) e tem como objetivo” [...] separar, quantificar e testar a significação dos efeitos de fatores contextuais em uma variável linguística” (GUY: ZILLES, 2007. p. 34).
O suporte de programas estatísticos Goldvarb, utilizados em estudos variacionistas, fornece, desse modo, ao pesquisador resultados sobre a atuação dos fatores individuais de cada variável explanatória sobre a variável dependente. Com o auxílio desse programa, o pesquisador consegue obter: (i) a frequência de realização das variantes; (ii) o peso relativo de cada um dos fatores que compõem as variáveis explanatórias; (iii) a seleção das variáveis explanatórias consideradas como estatisticamente relevantes; (iv) o nível de significância dos resultados quantificados.
A análise quantitativa foi realizada posteriormente à codificação dos dados das quatro comunidades estudadas. Os dados codificados foram inseridos no programa através do comando tokens, que comporta a opção generate fator specifications, responsável pela criação do arquivo de especificação com os fatores definidos para a análise da variável dependente. Após a criação desse arquivo, com a opção show fator specification, foi possível verificar se, de fato, todos os fatores haviam sido inseridos corretamente.
Com essas informações, procedemos à verificação das ocorrências com a opção check token. A correção dos dados foi possível ainda no comando token, na opção find and replace,
responsável pela identificação de cada um dos erros da codificação. Posterior à correção das ocorrências, a opção no recode, no comando tokens, possibilitou a criação do arquivo de condições, em que podemos realizar processos de amálgama e/ou eliminação de fatores na análise a depender das necessidades do pesquisador. A partir do arquivo de condições, no comando cells, através da opção load cells to memory, obtivemos o arquivo de células. Nesse arquivo, foi gerado o resultado geral da análise em termos percentuais.
Com o arquivo de células gerado, submetemos os dados à análise estatística. Antes, no entanto, com o retorno ao arquivo de condições, eliminamos os knockouts, resultantes da ocorrência categórica de uma das variantes em um determinado fator, e juntamos os grupos de fatores que julgamos necessários (cf. seção 4.3). Após a criação de um novo arquivo de células, sem a presença de knockouts e com as amálgamas necessárias realizadas, os dados foram submetidos à análise probabilística, para o que utilizamos, no arquivo de condições, as opções cells > binomial, up and down.
Desse modo, foi gerado o arquivo com os resultados estatísticos que serão apresentados na seção 4.3. Nesse arquivo, o programa atribui a cada fator um valor entre 0 e 1. Os valores apresentados, denominados de pesos relativos, os quais indicam a probabilidade de emprego das variantes no conjunto dos grupos de fatores controlados. Os resultados devem ser interpretados tomando-se como parâmetro o valor 0,50. Quando o valor apresentado é superior a 0,50, significa que o fator é um contexto favorável a aplicação da regra variável; quando inferior a 0,50, significa que o fator não se mostra como um contexto favorecedor. À medida que o valor se aproxima de 1, o contexto apresenta-se como mais favorável à aplicação da regra; e quanto mais próximo do valor zero, menor a probabilidade de influência do fator. Os fatores com valor igual a 0,50 são considerados como contextos neutros, ou seja, são fatores que não interferem na escolha por uma das variantes.
Os grupos de fatores são selecionados como estatisticamente relevantes considerando-se o
nível de significância e o teste da verossimilhança (log likelihood). O nível de significância é
o modo de conferir a análise uma confiabilidade estatística. Para que os dados sejam tidos como confiáveis, estabeleceu-se como parâmetro que o nível de significância seja igual ou inferior a 0,05. Desse modo, quanto menor o valor obtido, maior a probabilidade de os fatores selecionados apresentarem confiabilidade estatística para esclarecer o fenômeno variável e de a hipótese nula – que aponta a variação como aleatória – ser rejeitada.
Nas palavras de Scherre e Naro (2007, p. 165),
selecionar uma dada variável independente significa, portanto, inferir que, do ponto de vista estatístico, aquela variável dá conta de parte da variação que está sendo estudada. Em outras palavras, significa que a variação existente nos dados não é aleatória.
A análise estatística tem a sua relevância nos estudos variacionistas, no entanto, é preciso destacar o papel do linguista na interpretação dos resultados fornecidos pelo programa. Então, devemos sempre considerar que “os resultados numéricos obtidos pelos programas só tem valor estatístico”, pois “o seu valor lingüístico é atribuído e interpretado pelo linguista”, que poderá “refutar ou não as hipóteses estabelecidas quando da análise dos dados linguísticos” (SCHERRE; NARO, 2007, p. 162).
2.7 SÍNTESE DO CAPÍTULO
Este capítulo foi traçado com o objetivo de apresentar os princípios teóricos e metodológicos que nortearam a nossa pesquisa, centrada na observação da flexão de caso pronominal no
continuum do português popular da Bahia. Na primeira parte do capítulo – seção 2.1 –
apresentamos a concepção de língua e os principais conceitos definido pela teoria Sociolinguística – os de vernáculo, variação, comunidade de fala, regra variável e mudança. Com isso, procuramos demonstrar a importância de estudo do vernáculo para a observação das regras variáveis em uma comunidade de fala, a sistematicidade da variação e a correlação entre variação e mudança linguística.
Na segunda parte do capítulo – da seção 2.2 a 2.6 – descrevemos o passo a passo da pesquisa. Primeiramente, partimos da caracterização dos corpora analisados, e, em seguida, abordamos o tratamento dado às entrevistas socioloinguísticas recolhidas. Os critérios para o levantamento e codificação dos dados foram sistematizados posteriormente, quando apresentamos a variável dependente e o envelope da variação definido para a sua observação no português popular da Bahia. A parte do método é encerrada com a descrição de como se deu o processamento quantitativo dos dados.
Após a exposição dos fundamentos teóricos e metodológicos que norteiam a pesquisa, explicitamos, no capítulo 3, a revisão teórica do tema em estudo.
CAPÍTULO 3 – A FLEXÃO DE CASO DOS PRONOMES PESSOAIS: DO LATIM ÀS