Este capítulo é dedicado a explicitar os procedimentos metodológicos adotados para a verificação do emprego dos modos indicativo e subjuntivo, delimitando o estudo com a coleta de um banco de dados em forma eletrônica.
Propomos uma análise qualitativa, na qual se observam os dados a partir das teorias propostas, e quantitativa, na qual os resultados são descritos a partir dos totais resultantes de procedimentos estatísticos.
1. A amostra
Os dados utilizados para a realização dessa dissertação foram coletados de textos escritos em língua natural, armazenados eletronicamente em corpus e analisados através de
um programa de computação capaz de selecioná-los e ordená-los.22
Este banco de dados é constituído por jornais eletrônicos em língua espanhola, referentes aos anos de 1998 e 1999, coletados e organizados pelo Professor Philippe
Humblé23, e consultados com a ajuda do programa Microconcord (Mike Scott & Tim Johns).
Esta coleta de dados teve como objetivo principal organizar corpora em espanhol para resolver problemas de dicionários bilíngües utilizados por estudantes de espanhol como língua estrangeira. Estes dados foram obtidos através da junção de vários periódicos. As amostras
são constituídas e armazenadas com dados de 240 jornais de 20 países diferentes24.
Fazem parte deste material os seguintes países hispânicos: Argentina, Bolívia, Chile, Colombia, Costa Rica, Cuba, El Salvador, Equador, Espanha, Guatemala, Honduras, México, Nicarágua, Paraguai, Panamá, Porto Rico, Peru, Uruguai, Venezuela e República Dominicana. Estes países estão representados por jornais conhecidos como: Clarín, El Día, La Nación, da Argentina; Última Hora, El Día, do Paraguai; El País, La Noticia, do Uruguai;
22
A ferramenta computacional chamada “Concordancer” é um programa capaz de produzir listas de orações, em que uma palavra ou um conjunto de palavras aparecem centralizadas. Estas aparecem em contextos incompletos, mas podem ser ampliados para obter a oração completa, ou seja, o parágrafo no qual está inserido o texto da qual foi extraída.
23
Professor Doutor na Universidade Federal de Santa Catarina, a quem agradecemos a colaboração.
24
ABC, El País, El Mundo, da Espanha, além de outros citados em anexo no final deste trabalho.
As citações destes jornais são apresentadas pela notação que exemplificamos no quadro 2 abaixo:
Códigos utilizados para representar o corpus do espanhol
• O dia do mês está representado por dois dígitos: 01,02, 03, 10...
• O mês representado por letras do alfabeto: Janeiro A, fevereiro B, Março C, Abril D...
• Ano: 1998 =>8, 1999 =>9
• O nome do país está representado por duas letras:
Argentina AR Honduras HO
Bolívia BO México MX
Chile CH Nicarágua NI
Colômbia CO Panamá PN
Costa Rica CR Paraguai PY
Cuba CU Peru PE
Equador EC Porto Rico PR
El Salvador AS República Dominicana RD
Espanha ES Uruguai UR
Guatemala GU Venezuela VE
• O nome dos jornais também representado por letras (geralmente as iniciais dos jornais):
México Espanha
# El Nacional NA # ABC AB
# El Financiero EF # Diario de León LN
# Vanguardia VA # Diario de las Palmas DP
# La Jornada LJ # El Mundo MU
#Novedades Yucatán NY # Diario de Noticias DN Quadro 2 – Códigos dos jornais de língua espanhola
Estas indicações, portanto, são lidas da seguinte maneira: Exemplo 1: UREP10J8.TXT
UR => país (Uruguai) , EP => Jornal (El País), 10 => dia do mês, J => Mês do
ano (outubro), 8 => ano (1998) TXT25 => uma extensão de arquivo que indica
um arquivo de texto.
Exemplo 2: ASEF15E9.TXT
AS => País (El Salvador) , EF => Jornal (El Financiero), 15 => dia do mês, E => Mês do ano (maio), 9 => ano (1999) TXT => uma extensão de arquivo que
indica um arquivo de texto.
25
Exemplo 3: COMU28J8.TXT
CO => País (Colômbia) , MU => Jornal (El Mundo), 28 => dia do mês, J => Mês do ano (outubro), 8 => ano (1998) TXT => uma extensão de arquivo
que indica um arquivo de texto.
Convém salientar que os demais códigos dos outros jornais utilizados nessa pesquisa encontram-se em anexo, divididos de acordo com os países de onde provêm.
Para esta pesquisa utilizamos a amostra referente a cláusulas substantivas,
independentes e adverbiais26. Selecionamos algumas construções para cada uma das cláusulas
e verificamos a incidência das mesmas na linguagem da imprensa escrita eletrônica. Segue na tabela abaixo, as construções analisadas e o total de orações encontradas no programa:
Cláusulas Itens em estudo Total de dados analisados
“Creer que” 1712
“Pensar que” 455
“Saber que” 748
“No creer que” 199
“No pensar que” 12
Substantivas
“No saber que” 35
“Es cierto que” 201
“Es posible que” 157
Substantivas
(expressões impessoais)
“Es necesario que” 91
“Seguramente” 340
“Quizá” (Posposto ao verbo) 279
“Quizá” (Anteposto ao verbo) 448
“Tal vez” (Posposto ao verbo) 289
Independentes
“Tal vez” (Anteposto ao verbo) 445
“Para que” 1558
Adverbiais Finais
“A fin de que” 85
“Después de que” 179
Adverbiais Temporais
“Cuando” 1675
Adverbial concessiva “Aunque” 1456
Total 10.364
Tabela 2 – Total de construções analisadas na pesquisa
2. Análise dos dados
O caráter exploratório e delimitado do estudo previu a discussão dos resultados obtidos, apresentados em duas etapas:
26
Selecionamos certas expressões que são objeto de estudo deste trabalho. Não incluímos as orações adjetivas neste rol, devido às dificuldades de análise de adequação do concordanciador ao exame do corpus.
1) a análise lingüística do sistema de modo verbal da língua espanhola, onde são detalhadas as regras impostas por manuais da língua
2) a verificação dos dados jornalísticos com relação às normas estabelecidas sob uma abordagem quantitativa de fenômenos lingüísticos, através do exame de textos heterogêneos, oriundos da língua escrita jornalística de período recente.
O procedimento de coleta e a verificação dos dados jornalísticos permitem discutir se as prescrições que as gramáticas consultadas postulam para o espanhol condizem com textos atuais da imprensa escrita.
Através da análise das freqüências de uso dos modos nas construções analisadas, observamos o comportamento dos itens em estudo, através da manipulação dos dados facilitada pelo concordanciador descrito, submetendo os dados às hipóteses propostas nesta dissertação e fazendo generalizações a respeito dos usos dos modos indicativo e subjuntivo.