Chapitre 2 : Caractérisation des défauts
II. Etude de la porosité
II.3 Analyse déterministe et probabiliste des résultats de la porosité
II.3.1 Protocole de caractérisation probabiliste
Quando iniciamos esta pesquisa com o verbo FAZER, tínhamos em mente estabelecer uma análise comparativa entre o verbo FAZER no gênero conversação espontânea e o verbo FAZER no gênero acadêmico-científico. Por isso, alguns exemplos apresentados na primeira etapa desta tese foram dessa coleta. Os dados de conversação vieram do banco de dados do GREF e os dados do gênero acadêmico-científico foram coletados de maneira aleatória em artigos de revistas de divulgação científica. Contudo, os objetivos a serem atingidos, as hipóteses levantadas, bem como os limites impostos pelo tempo e espaço fizeram com que decidíssemos nos ater a um único corpus de um gênero específico para a verificação da proposta descritiva.
Foi utilizado, então, um banco de dados pertencente ao projeto Linguateca. Este projeto86 tem “como objetivo servir a comunidade que se dedica ao processamento da nossa
língua”. Mais especificamente, o corpus empregado foi o projeto AC/DC que é, assim, descrito. O projecto AC/DC (Acesso a corpos/Disponibilização de corpos), iniciado em 1999, surgiu da necessidade de juntar os poucos recursos disponíveis num único ponto na rede e dessa forma facilitar a comparação e a reutilização do material, permitindo ao mesmo tempo acesso a uma ferramenta poderosa de interrogação de corpos, o sistema CWB (versão nova do IMS corpus workbench), para o qual desenvolvemos esta interface.87.
Os corpora disponíveis na Linguateca estão anotados, o que quer dizer que é possível, por meio de fórmulas elaboradas com o uso de linguagem computacional, procurar, em cada corpus, informações sintáticas e morfológicas. A vantagem de se utilizar a fórmula é a facilidade para se conseguir um número grande de ocorrências de um item linguístico dentro de um contexto específico. Para se ter acesso às ocorrências com FAZER, utilizou-se uma fórmula específica e obteve-se uma amostra aleatória de 8000 ocorrências com FAZER encontradas no corpus “CHAVE”, que é um corpus pertencente ao projeto AC/DC e composto por textos jornalísticos dos anos de 1994 e 199588.
8686 As informações sobre o projeto Linguateca foram retiradas de: http://www.linguateca.pt/ACDC/. Acesso em: 12 fev. 2015.
87 Informações disponíveis em: http://www.linguateca.pt/ACDC/. Acesso em: 12 fev.2015.
88 A fórmula para acessar as ocorrências com FAZER foi gentilmente elaborada por Anya Campos, doutoranda em Estudos Linguísticos pela UFMG.
Os textos jornalísticos se constituem juntamente com os textos de gênero acadêmico- científico, “exemplares” da língua padrão escrita. Segundo Perini (1985), o texto jornalístico apresenta
uma grande uniformidade gramatical: não só as formas e construções encontradas nos jornais e revistas são as mesmas dos compêndios e livros científicos, mas também não se percebem variações regionais marcadas. [...]. Isto é, existe um português padrão altamente uniforme no País, e podemos encontrá-lo nos textos jornalísticos e técnicos. (PERINI, 1985, p.85-86).
Muitas ocorrências desse corpus já foram mencionadas nos capítulos anteriores a título de ilustração e para se atestarem acepções, usos e construções. Neste capítulo, o objetivo é verificar o padrão de comportamento do verbo FAZER em termos das construções a que ele se integra. Para tanto, foram analisadas as primeiras 1079 ocorrências da amostra em um total de 25082 palavras.
A título de ilustração apresentam-se as 10 primeiras ocorrências obtidas no corpus: FSP940829-017: O governo brasileiro tem o dever internacional de fazer um inquérito, ouvir as testemunhas e punir os responsáveis.
FSP941221-115: Tudo que eu fazia era criticado, motivo de ostracismo, me condenaram, me botaram no limbo. FSP940311-008: É um sinal dos novos tempos, esses tempos que fizeram os «loucos de Deus», esses xiitas fundamentalistas de todo gênero e, agora, fazem os loucos de Chiapas, esses homens que carregam um ressentimento secular e as injustiças do presente.
FSP940123-001: Viveu em sítio, fez arte em seda.
FSP950715-008: Recentemente, o economista Dalmo Reis, em artigo publicado em jornal carioca, destacou uma série de observações pertinentes, fazendo surgir das supostas evidências as distorções que a hegemonia de São Paulo provocou no sistema tributário.
FSP940928-097: Durante a rotação, o papel é pressionado contra o cilindro fazendo com que o toner seja transferido para o papel.
FSP940816-072: O volante Ezequiel, com entorse no joelho direito, fez um exame de ressonância magnética e está fora da partida.
FSP941121-103: Acho que faço parte de uma geração que tem todas as informações necessárias para encontrar rapidamente o que quer e conseguir realizar o que quer porque é apenas uma questão de escolha.
FSP940420-071: Faço o orçamento com meus fornecedores e, se o cliente estiver de acordo, mando importar o produto», diz Bruna Zuppone, proprietária da loja.
FSP950422-024: A professora brasileira Angela Harkavy, da George Mason University, fez a questão. Fonte: Corpus Linguateca
Em relação à amostra, cumpre esclarecer que a sequência de caracteres que precede o dado representa a fonte (Folha de São Paulo – FSP) e a data da publicação (ano/mês/dia) e um
número de identificação. Como podemos perceber, esse número não segue uma sequência, justamente porque os dados são apresentados de forma aleatória.
Percebemos nessa pequena amostra que o programa permite visualizar as ocorrências de FAZER dentro dos limites do período. É claro que, se nosso objetivo nesta análise fosse de cunho mais explanatório, como, por exemplo, buscar razões para a ocorrência de uma construção em determinado contexto, seria necessário trabalhar com limites contextuais mais amplos. Como nossa intenção é identificar as construções com FAZER, em uma perspectiva mais descritiva, o limite do período foi, na maioria dos casos, suficiente. Alguns problemas surgiram, como se verá, principalmente para os casos de “fronteira” que exigiriam um pouco mais de informação contextual. Outro aspecto importante da amostra é que FAZER ocorre em diversos modos, tempos, vozes e flexões.
Ainda sobre a amostra, é interessante mencionar que, apesar de os dados terem sido retirados de textos escritos, algumas ocorrências incluem transcrições da língua falada, como por exemplo, trechos de entrevistas ou falas de pessoas públicas. Vejamos dois exemplos.
(176) FSP951231-063: Folha -- O sr. acredita que o governo chinês fará concessões políticas?
(177) FSP940424-148: «Tudo o que fazemos é reconhecido», completa Robson Chagas da Silva, courier no Rio.
Esse fato não compromete a nossa análise visto que nossa intenção é verificar e analisar as relações entre as ocorrências reais da língua e as construções. Não se constitui objetivo principal deste trabalho analisar aspectos associados à modalidade oral e escrita e nem tão pouco ao gênero textual, embora se reconheça que, pela visão cognitivo-funcional, esses fatores interfiram no comportamento linguístico dos falantes.
Na próxima seção, mostraremos como foi feita a classificação das ocorrências bem como algumas dificuldades que encontramos para classificá-las.