Doc-mobility fellowship project
2.2 Study 2: Abnormal auditory processing and underlying structural changes in 22q11.2 Deletion Syndrome 22q11.2 Deletion Syndrome
Sinclair (1991) destaca o surgimento de novas evidências sobre como a linguagem é usada e afirma também que surgem novos paradigmas descritivos influentes, utilizando os elementos fornecidos pela extensa análise de corpus. O autor também expõe, em sua referida obra, uma série de ganhos advindos do uso de corpora nos estudos sobre a linguagem. Compilamos algumas de suas ideias, conforme listadas a seguir:
A análise de textos autênticos, falados e escritos, e, em particular, o processamento computacional de textos revelaram padrões linguísticos não esperados […] A grande diferença tem sido a disponibilidade de dados […] a grande novidade foi o registro de evidências completamente novas sobre como a língua é usada […] e as evidências objetivamente compiladas de textos são enormes e sistemáticas […] A língua mostra-se diferente quando examinada extensivamente (SINCLAIR, 1991, p. XVII; I; 2; 4; 100; 489)22.
Em 2004, Sinclair continua descrevendo os desdobramentos da relação entre os estudos e as evidências contidas nos corpora. O autor reitera as mudanças no modo de lidar com as evidências. Para ele, temos que “cultivar uma nova relação entre as ideias que temos e as evidências que estão diante de nós” (SINCLAIR, 2004, p. 17), pois “com grandes corpora e potentes computadores estamos nas fronteiras de uma nova visão da língua, onde podemos apreciar toda a sua complexidade sem sermos impedidos pelos detalhes” (SINCLAIR, 2004, p. 166)23. Com base nisso, acreditamos que a LC configura uma forma diferenciada de visualizar e explorar a linguagem.
22 No original: Analysis of extended naturally occurring texts, spoken and-written, and, in particular, computer processing of texts have revealed quite unsuspected patterns of language […] The big difference has been the availability of data […] [The] major novelty was the recording of completely new evidence about how language is used […] and the evidence compiled objectively from texts is huge and systematic […] The language looks
different when you look at a lot of it at once (SINCLAIR, 1991, p. XVII; I; 2; 4; 100; 489).
23 No original: With large corpora and powerful computers we are at the frontiers of a new view of language, where we can appreciate its full complexity without getting hampered by the detail (SINCLAIR., 2004, p. 166).
Carter (2003), ao introduzir a obra de Sinclair (2004), corrobora as ideias do autor, impelindo-nos a confiar no texto, confiar no potencial que existe nos dados:
As paisagens dos estudos linguísticos estão mudando diante de nossos olhos como resultado das possibilidades propiciadas por corpora e pela linguística computacional. E com cada novo avanço ficará cada vez mais claro que o texto poderá e será confiável (CARTER, 2003, p. 6)24.
Deste modo, Carter (2003) nos mostra como as possibilidades de estudar as evidências linguísticas foram ampliadas pela contribuição dos computadores e esse fato, segundo Carter (2003) e Sinclair (2004), configura novas situações, permite novos estudos com um novo olhar para os dados. Com base nos referidos autores, acreditamos estar diante de uma forma inovadora de abordagem da língua, proporcionada pela LC, a qual leva-nos a descobrir novas hipóteses e nos permite propor novas reflexões sobre a língua em uso.
A necessidade de uma Linguística descritiva é apontada de forma veemente por Perini (2006; 2008) quando ele menciona que falta a ampla descrição de dados linguísticos que sejam observados, organizados e sistematizados para estudo. Perini (2006; 2008) destaca que há carência de dados coletados para se desenvolver uma descrição antes de se propor teorizações, ou seja, o autor chama a atenção para a questão de que teorias são elaboradas sem estarem ligadas, suficientemente, a fatos linguísticos. É importante esclarecer que Perini (2006; 2008) não despreza a importância da teorização, mas dá ênfase ao desenvolvimento de uma linguística descritiva, de maneira a valorizar o uso concreto da língua.
Ao expor os princípios da linguística descritiva (2006) e seus estudos de gramática descritiva (2008), Perini lista algumas características que o linguista deve possuir, a saber: se interessar pela língua como ela é, e não como ela deveria ser; partir sempre de fatos linguísticos para sua análise e não confundir suas hipóteses com os fatos; registrar e descrever como é que as pessoas realmente falam e/ou escrevem; e, sistematizar os fatos da língua encontrados. Observamos que esses princípios também estão presentes na LC.
Embora Perini (2006; 2008) não esteja se referindo diretamente à LC e nem a corpora eletrônicos, ele reconhece que o uso de corpus, de maneira geral, tem a vantagem de neutralizar os desejos do pesquisador. Pois, se o linguista se valer apenas da introspecção, isso pode influenciar subjetivamente os resultados de sua análise.
24 No original: The landscapes of language study are changing before our eyes as a result of the radically extended possibilities afforded by corpus and computational linguistics. And with every new advance it will be ever more likely that the text can and will be trusted (CARTER, 2003, p. 6).
A LC configura para nós uma forma de abordar a língua que permite a descrição, que possui uma metodologia descritiva, porque dá primazia aos dados e às evidências empíricas em detrimento da introspecção do pesquisador.
Lembramos que a LC comporta princípios para obtenção de dados, tanto orais como escritos, com base em linguagem natural, autêntica e na coleta de fontes primárias. Permite, assim, uma boa sistematização dos dados linguísticos e uma descrição da língua objeto do corpus de estudo a fim de checar o uso na prática, fornecendo-nos uma base confiável de dados “para construir e testar eventuais teorias” (PERINI, 2006. p. 11).
A LC responde, ao menos parcialmente, às queixas de Perini, quando ele se refere à falta de estudos descritivos, pois para ele é preciso dar “ênfase no levantamento de dados como a maneira de fundamentar as teorias” (PERINI, 2008, p.14). Assim, a LC é uma forma de resposta às queixas de que os estudos linguísticos carecem de mais evidências, de que é preciso elaborar “bases de dados cuidadosamente colhidos, sistematizados e descritos, cobrindo áreas significativamente grandes de línguas naturais particulares”, pois a investigação linguística depende de dados “suficientemente amplos e adequados” (PERINI, 2008, p.14).
Pelo seu empirismo e pela sua capacidade de mobilizar uma grande quantidade de dados linguísticos autênticos, a LC constitui uma metodologia-abordagem muito potente. Parodi afirma que a LC apresenta: “oportunidades revolucionárias para a descrição, análise e ensino de discursos de todo tipo […] caracteriza-se por dar sustento à investigação da língua em uso […]” (PARODI, 2010, p.14)25.
O empirismo é uma das características mais relevantes para a LC, vejamos o que significa a abordagem empírica da LC:
Com a Linguística de Corpus, dados empíricos são fornecidos, tornando a pesquisa mais fundamentada em fatos “concretos” do que especulação. Muitos detalhes que frequentemente “escapam” aos olhos do leitor podem ser percebidos com a ajuda dos dados quantitativos, ajudando a ressaltar certas características dos textos (FEITOSA, 2005, p. 35).
Deste modo, percebemos que a abordagem empírica é um meio de fundamentar a pesquisa em fatos concretos. De acordo com Berber Sardinha (2004, p. 30), “na linguística, empírico significa dar primazia aos dados provenientes da observação da linguagem”. Na LC, a abordagem empírica é um pressuposto, pois coletar dados autênticos e trabalhar com a
25 No original: “oportunidades revolucionarias para la descripción, análisis, y enseñanza de discursos de todo tipo. [...] se caracteriza por brindar sustento a la investigación de la lengua en uso [...]” (PARODI, 2010, p.14).
linguagem em uso permite-nos uma observação que “revela uma quantidade surpreendente de evidências linguísticas” (BERBER SARDINHA, 2004, p. 384).
Isso está diretamente ligado à noção de linguagem adotada pela LC, pois os dados permitem verificar traços que se repetem, padrões de comportamento linguístico, e assim, atestar se existem regularidades sistemáticas e quantificá-las, confirmando inclusive a hipótese de que não são aleatórias, ou, ainda, refutar hipóteses sobre o funcionamento da língua.
Essas hipóteses podem ter sido previamente estabelecidas, em um estudo corpus-based (baseado em corpus) ou podem ser levantadas hipóteses à posteriori, a partir da observação dos dados coletados, visto que os resultados de um corpus compilado podem direcionar o estudo, nesse caso, um estudo corpus-driven (direcionado pelo corpus),trataremos desses dois tipos de abordagem em LC no tópico 3.3.4.
Seguindo essa perspectiva, podemos também dizer que a LC permite trabalhos muito variados, com abordagens distintas, e pode ser desenvolvida de modo a instrumentalizar diferentes teorias.
A seguir, retomamos o histórico da LC, a definimos e abordamos alguns conceitos.