A quantificação das ocorrências da forma se foi dividida por Lima (op. cit.) em duas partes de acordo com os diferentes objetivos e naturezas dos cálculos estatísticos utilizados. Em primeiro lugar, são apresentados os resultados das porcentagens, freqüências absolutas e relativas (por mil) considerando as ocorrências dos corpora nos três períodos analisados. Essas duas noções são definidas da seguinte maneira:
- Freqüência Absoluta: constitui-se da divisão número de ocorrências por tipo dividido pelo total de ocorrências por período.
- Freqüência Relativa: constitui-se da divisão do número de ocorrências por tipo dividido pelo total palavras do texto multiplicado por mil. O valor retornado é a freqüência do tipo no texto ou período analisado a cada mil palavras.
Em segundo lugar, são apresentados os resultados do teste qui-quadrado, que calcula a probabilidade de a alteração da freqüência dos tipos do pronome se ser relevante, ou seja, demonstra, em termos estatísticos, se a variação da freqüência está relacionada diretamente à interferência dos períodos analisados. Não apresentaremos aqui os resultados do teste qui-quadrado realizado por Lima que mostram, de acordo com o que esperávamos, que as variações de freqüência encontradas são relevantes estatisticamente55.
55 A aplicação e relevância do teste qui-quadrado é também discutida em Vitral (2005) para a análise de gramaticalização da forma verbal ter.
Vejamos agora, por meio das tabelas abaixo, os resultados estabelecidos para os três períodos considerados. Nestas tabelas, a segunda coluna informa a freqüência absoluta, a terceira indica o percentual de ocorrência de cada tipo em relação ao total de ocorrências de se encontradas; a quarta coluna informa a freqüência relativa; e a primeira coluna indica, abreviadamente, o tipo de ocorrência de se que consideramos, da seguinte maneira:
(8) Ref = reflexivo Est = estilístico Pro = pronominal Pas = passivo Amb = ambíguo Ind = indeterminador
A fim de facilitar o comentário dos resultados encontrados, dividiremos os tipos de (8) em dois grupos: o primeiro deles, composto de Ref, Est e Pro, será chamado de grupo reflexivo; e o segundo, ao qual pertence Pas, Amb e Ind, nomearemos de grupo não-reflexivo.
No período arcaico, contabilizamos 314 ocorrências de se distribuídas pelos tipos considerados:
Tabela 1
Descrição das porcentagens e freqüências por tipo no período arcaico.
Como se vê, no período arcaico, o tipo Ref é o que mais ocorre, correspondendo sozinho a 28% do total das ocorrências, enquanto os demais tipos reflexivos ocorrem
Tipo Freq Ab. Porc. % Freq.por mil
Ref 88 28,0 2,64 Est 44 14,0 1,32 Pro 31 9,9 0,93 Pas 50 15,9 1,50 Amb 79 25,2 2,37 Ind 22 7,0 0,66 Total 314 100 9,40
em menor freqüência, isto é, 14% para Est e 9,9% para Pro. Somados, os tipos do grupo reflexivo correspondem a 51,9% do total.
Por outro lado, os tipos do grupo não-reflexivo totalizam 48,1% das ocorrências de se distribuídos da seguinte maneira: 25,2% para Amb, 15,9 % para Pas e 7% para Ind.
Já a freqüência global do pronome se no período arcaico é 9,4 (p/mil). O tipo com maior índice de freqüência é Ref =2,64 (p/mil), seguido de Amb= 2,37 (p/mil). Os tipos do grupo reflexivo totalizam o índice de 4,89 (p/mil), enquanto os tipos do grupo não-reflexivo chegaram a 4,51 (p/mil).
Passemos aos resultados do período moderno.
Nos textos do período moderno, recolhemos 816 ocorrências distribuídas em todas as funções analisadas.Vejamos a tabela abaixo:
Tabela 2
Descrição das porcentagens e freqüências por tipo no período moderno
De acordo com a tabela acima, o tipo Ref ocorre em 21% dos casos e somado com os tipos Est e Pro, respectivamente, 3% e 15%, o grupo reflexivo totalizou 39% das ocorrências.
No grupo não reflexivo, o tipo Amb proporcionou-nos 34%, o tipo Pas 19% e
Ind 7%. Somados, os tipos desse grupo correspondem a 61% do total das ocorrências.
Tipo Freq Ab. Porc. % Freq.por
mil Ref 175 21 3,68 Est 28 3 0,59 Pro 126 15 2,65 Pas 151 19 3,17 Amb 281 35 5,90 Ind 55 7 1,16 Total 816 100 17,15
A freqüência global do pronome se no período moderno é de 17,15 (p/mil). O tipo com maior índice de freqüência no período é Amb= 5,90 (p/mil), seguida de Ref= 3,68 (p/mil). Os tipos do grupo reflexivo apresentam freqüência de 6,96 (p/mil), ao passo que os tipos do grupo não-reflexivo somados chegam a 10,19 (p/mil).
Vejamos a seguir os resultados do período contemporâneo.
No período contemporâneo, foram encontradas 420 ocorrências do pronome se, distribuídas de acordo com a tabela abaixo:
Tabela 3
Descrição das porcentagens e freqüências por tipo no período contemporâneo.
De acordo com a tabela acima, os tipos do grupo reflexivo reduzem sua participação no universo das ocorrências de se, ou seja, o tipo Ref totaliza 10,48%,
Pro 11,90% e Est 0,24%, correspondendo a 22,62% do total. Por outro lado, há
um incremento da freqüência dos tipos do grupo não-reflexivo cujo resultado é o seguinte: Ind= 34,52%, Amb= 35,24%, e Pas= 7,62%; e, juntos, esses tipos correspondem a 77,38% do total das ocorrências. Já a freqüência global do pronome no período contemporâneo é de 4,07 (p/mil).Os tipos do grupo reflexivo, somados, apresentam freqüência de 0,92 (p/mil), e os do grupo não- reflexivo de 3,15 (p/mil).
Tipo Freq Ab. Porc. % Freq.por
mil Ref 44 10,48 0,43 Est 1 0,24 0,01 Pro 50 11,90 0,48 Pas 32 7,62 0,31 Amb 148 35,24 1,43 Ind 145 34,52 1,40 Total 420 100,00 4,07
5.2.1 A quantificação das ocorrências e a gramaticalização de se
A distribuição de se de acordo com os tipos destacados e a freqüência deles nos três períodos confirmam a hipótese de gramaticalização desta forma pronominal.
Vamos observar, em primeiro lugar, que há aumento da freqüência dos tipos do grupo não-reflexivo em detrimento da freqüência dos tipos do grupo reflexivo: os primeiros apareceram em 48,1% das vezes no período arcaico, em 61% das vezes no período moderno e em 77,38% no período contemporâneo. Inversamente, a freqüência dos tipos do grupo reflexivo diminui: obtivemos 51,9% no período arcaico, 39% no moderno e 22,62% no contemporâneo. Como desenvolveremos na próxima seção, os tipos do grupo não-reflexivo são “mais gramaticais” que o se reflexivo e os outros tipos do grupo reflexivo.
Ocorre também aumento da freqüência do tipo Ind que de 7% nos períodos arcaico e moderno passa a 34,52 no contemporâneo. Na próxima seção, veremos que o tipo Ind é o tipo “mais gramatical” de se. O fato de termos obtido o mesmo índice de 7% para este tipo nos períodos arcaico e moderno pode ser pensado a partir do incremento do tipo Amb no período moderno. Como dissemos, a ambigüidade em questão diz respeito à nossa dificuldade de discernir entre os tipos Ind e Pas, mas o falante fez uma escolha em relação a um desses tipos. Ora, o tipo Amb aumenta consideravelmente na passagem do arcaico para o moderno: de 25,2% para 34%. Vamos supor então que parte desses 34%, difícil (ou impossível) de ser precisada, é, na realidade, casos de Ind, o que nos leva a concluir que o índice de ocorrências de Ind no moderno deve ser maior que os 7% aferidos. É óbvio que a dificuldade de precisarmos o índice real de Pas e Ind está também presente quando se observam os índices de Amb no arcaico, isto é, 25,2%, e no contemporâneo, ou seja, 35,24%. É razoável supor, no entanto, já que o índice de Ind aumenta, que o aumento do tipo Amb deve ser debitado ao aumento dos casos de Ind.
É também esperada a diminuição da freqüência de Pas encontrada na comparação do arcaico com o contemporâneo: como discutiremos a seguir, o tipo Pas é “menos gramatical” que o tipo Ind. Há, seguramente, outros aspectos a serem pensados em relação ao tipo Pas: o mais evidente deles é como se distribui a concorrência deste tipo com a passiva perifrástica, o que pode lançar luz acerca do aumento desse tipo do arcaico para o moderno. Mas não o faremos aqui.
A redução da freqüência do tipo Ref é também altamente esperada: de 28% no arcaico para 21% no moderno e 10,48% no contemporâneo. Já que no nosso recorte de tempo, Ref foi tomado como estágio inicial da gramaticalização e, como veremos
na seção seguinte, é o tipo ‘menos gramatical”, esperávamos atestar que, à medida que a forma se se gramaticaliza, o tipo Ref “perca terreno” para os tipos “mais gramaticais”. E foi isso que, de fato, ocorreu. Neste caso, também valeria a pena cotejar a freqüência do tipo Ref com a das formas perifrásticas como a si mesmo ou ele/ela(s) mesmo/a(s), sobretudo no contemporâneo.
A diminuição do tipo Est, de 14% no arcaico para 3% no moderno e 0,24% - o que é praticamente seu desaparecimento - no contemporâneo comprova que esse estágio foi o primeiro do percurso (a) de (7), isto é, o percurso envolvendo os tipos do grupo reflexivo. Já o segundo estágio deste percurso, isto é, o tipo Pro, aumentou do arcaico para o moderno, de 9,9% para 15% e teve queda significativa no contemporâneo, ou seja, 11,90%. Esses resultados, aliados à freqüência por mil, isto é, 0,93>2,65>0,48 mostram uma tendência a uma diminuição drástica desse tipo, sobretudo quando sabemos que, em alguns dialetos do português brasileiro, esse tipo praticamente não ocorre. Esses resultados favorecem nossa posição de pensar os dois percursos de (7) como percursos paralelos, evitando assim a linearidade estrita do ciclo de Hopper e Traugott (1993, cf.(16) abaixo))
A hipótese da gramaticalização é também reforçada quando comparamos os índices de freqüência por mil dos períodos arcaico e moderno. Houve aumento considerável, isto é, de 9,40 para 17,15, o que é esperado já que, nesse tipo de processo, como comentamos na seção 2, o item em análise, além do uso inicial, passa a apresentar também usos inovadores. Não é esperado, porém, o decréscimo robusto do emprego do se no contemporâneo, que foi de 4,07. A solução deste problema pode vir do fato de que, em relação ao período contemporâneo, levamos em conta textos do português brasileiro que, fartamente documentado na literatura, exibe queda acentuada do emprego de clíticos pronominais (cf.Duarte (1995), Pagotto (1993)). Acredita-se também que tal decréscimo se associa ao estágio zero da gramaticalização, ou seja, o fato de que o último estágio de um ciclo de gramaticalização é a extinção do item. Uma análise de corpus de língua falada pode confirmar essa proposta, isto é, espera-se que na modalidade falada, ocorra, com grande freqüência, o apagamento de se, o que é compatível, assim, com o índice de 4,07 de emprego de se no período contemporâneo.