7. FUEL ASSEMBLY DEGRADATION MECHANISMS IN
7.2. Degradation mechanisms affecting the fuel cladding
7.2.6. CANDU fuel degradation under dry storage conditions
Em seguida, os textos analisados neste trabalho foram tratados através de um processo de filtragem automática que contemplou duas etapas complementares: primeira, termos gramaticais sem significação intrínseca e com menor peso de conteúdo foram eliminados (como por exemplo artigos e preposições); segundo, as palavras restantes, conceitualmente significativas para nosso estudo, foram convertidas para a sua forma canônica, eliminando-se qualquer variação de número, gênero ou flexão do tempo.
Durante o processo de filtragem automática, foi utilizada uma série de programas oriundos do pacote UNITEX (UNITEX, 2002) e das suas modificações decorrentes dos trabalhos de Caldeira (2005) e Teixeira (2007). O Unitex é um software livre que foi desenvolvido inicialmente pelo grupo de pesquisas em linguística computacional do Institut d’Élétronique et d’Informatique Gaspard-Monge (IGMFrance), na França, e, atualmente, conta com o apoio internacional da REDE RELEX (uma associação de Laboratórios de Estudos Linguísticos que desenvolve estudos em diversos idiomas). O UNITEX contém diversos recursos embutidos, tais como: Alphabet e Alphabet_short, Convert, Dela, Fst2txt, Normalize, Sentence, system_dic e Tokenize; correspondendo à um pacote de dicionários eletrônicos, gramáticas e tábuas léxico-gramaticais que possibilitam a avalição em níveis morfológicos e sintáticos de diversos sistemas linguísticos. De modo suplementar, contamos com as modificações destes executáveis que foram implementas por Caldeira (2005) e Teixeira (2007), que os tornaram mais apropriados para o uso no tratamento de redes de palavras, dissolvendo ambiguidades, eliminando palavras gramaticais e realizando a canonização inflexiva dos termos. Ou seja, além dos 9 (nove)
arquivos e aplicativos provenientes diretamente do UNITEX, citados acima, utilizamos também o Ambisin resultante dos trabalhos acima referidos.
O programa Ambisin adota como parâmetro o arquivo Ambisin.gra, responsável por identificar as classes gramaticais que devem ser eliminadas e que são abreviadamente etiquetadas segundo convenção correspondente às suas classificações gramaticais (PRO, DET, PREP, ABREV, INTJ e CONJ). Subsequentemente, o texto é processado pelo arquivo de filtragem Ambisin_e.can, que exclui as palavras reconhecidas por suas etiquetações, visto que Ambisin_e.can é um arquivo editável e foi configurado para eliminar os signos que não trazem carga semântica intrínseca, tal qual discutiremos sob os parâmetros da nossa seleção lexical preferencial. Ao final, na lista resultante de arquivos em formato (*.dlf.txt) permanecem somente as unidades lexicais que interessam para compor as sub-redes dos conceitos usadas em nosso trabalho.
A seleção lexical preferencial é fundada na perspectiva de que nem todas as palavras são necessárias para capturar a estrutura conceitual das temáticas abordadas pelos livros. O processo seletivo que conduziu à exclusão de vocábulos determinados foi realizado com base na distinção entre “palavra gramatical” e “palavra lexical” (David Crystal, 1985; Martins, 2003). As palavras gramaticais, denominadas também palavras-instrumento, palavras-formas, palavras vazias, instrumentos gramaticais ou ainda “não palavras”, possuem, segundo as regras gramaticais, a função específica de garantir a concordância das estruturações morfológicas dos enunciados. Contudo, são desprovidas de sentindo próprio e têm apenas um papel organizacional na construção das sentenças frasais. Tratam-se de preposições, pronomes, artigos, numerais, advérbios, conjunções e interjeições, os quais não se referem semanticamente a fenômenos ou objetos do mundo real; ou seja, possuem sua existência meramente restrita às condicionalidades intralinguísticas. Entretanto, ainda que elas sejam muito menos diversas em relação às palavras lexicais, são empregadas com altíssima frequência durante a elaboração dos enunciados. Por serem desprovidas de significado intrínseco e se repetirem com alta frequência, elas foram excluídas dos textos, para que pudéssemos focar nas relações e nos significados das palavras lexicais. Como argumenta Caldeira (2007), “conservar as palavras gramaticais no tratamento dos textos impediria a visualização das noções conceituais, sobrepondo-se às palavras ditas com significação as mesmas iriam borrar o foco das investigações desejadas”.
Em condição diametralmente oposta, as palavras lexicais, também denominadas nocionais, reais, plenas ou lexicográficas, se referem semanticamente a fenômenos, objetos do mundo real ou podem também ter significados abstratos. Como compreendem as palavras que se referem aos seres, ações, qualidades, processos e mecanismos que fazem parte do mundo físico, biológico, psíquico, científico ou social, estes termos incluem todos os elementos conceituais relevantes para a nossa análise de redes semânticas.
Consequentemente, foram preservadas em nosso tratamento de textos apenas as palavras lexicais, em detrimento às palavras gramaticais. Uma exceção foram os verbos, adjetivos e advérbios que, apesar de serem consideradas palavras lexicais, foram também eliminados, por não corresponderem diretamente aos conceitos científicos que integram nosso foco investigativo. Por exemplo, certos verbos ocorrem com alta frequência nos enunciados, repetindo-se diversas vezes na composição das diferentes sentenças e, em decorrência desta condição, os verbos conectam diferentes cliques na rede, integrando comunidades que seriam conceitualmente desconexas. Os verbos também assumiriam valores de grau e centralidade de intermediação muitas vezes maiores do que os valores obtidos para os conceitos de interesse em nossa pesquisa. Por exemplo, no caso da língua inglesa (empregada nos textos analisados), teríamos os verbos "to be" e "to do" como os termos mais importantes de praticamente todas as redes. Ao invés de elucidar relações teórico-conceituais, isso iria apenas dificultar a análise das mesmas. Os procedimentos metodológicos de exclusão acima referidos têm sido correntemente usados em diversos trabalhos que analisam redes semânticas, a exemplo de Biderman (2001), Caldeira (2007) e Toscano (2014).