• Aucun résultat trouvé

I. ÉTUDE BIBLIOGRAPHIQUE

I.3. MODÉLISATION DE LA CROISSANCE MICROBIENNE

I.3.4. DÉFIS DE LA MODÉLISATION DE LA CROISSANCE MICROBIENNE DANS UN ALIMENT RÉEL

As técnicas utilizadas — Análise de Correspondências, Classificação Hierárquica e Não Hierárquica — permitiram, tal como se pretendia, identificar alguns dos temas presentes nas 227 notícias como se pode ver nas Figuras 3.25 e 3.26.

Figura 3.25: Quadro resumo dos temas identificados — conjunto de dados notícias.

Figura 3.26: Quadro resumo dos temas identificados — conjunto de dados notícias e entidades.

Através destes quadros é visível uma maior informação extraída do segundo conjunto de dados. De facto, houve uma maior dificuldade em encontrar temas no primeiro conjunto de dados, em grande parte devido à dificuldade em retirar informação das palavras retidas. É notório que a utilização das entidades é uma mais valia. Em primeiro lugar evita que palavras como ‘cento’, ‘mil’, ‘milhões’, ‘euros’ apareçam na lista de palavras com mais relevância possibilitando uma análise mais cuidada e sem

Relativamente aos métodos observou-se uma importante contribuição dos mé- todos de Classificação. Apesar de existirem alguns grupos não completamente ho- mogéneos na Classificação, conclui-se que estes métodos foram um complemento importante à Análise de Correspondências. Identificaram-se muitos temas seme- lhantes àqueles obtidos na AC, mas também foi possível identificar novos temas, contribuindo para um conhecimento mais aprofundado acerca do conjunto das no- tícias.

Ainda existe alguma dificuldade em manusear o texto e interpretar os resultados. Há dificuldade na identificação de temas pois na Análise Classificatória são obtidas classes com muitos elementos e torna-se difícil saber qual o elo de ligação dessas notícias. Mais uma vez, devido à visualização das entidades, o mapa de Kohonen permite ultrapassar grande parte deste problema. Outra dificuldade diz respeito à diversidade do conjunto de dados. Por ser um conjunto de dados com muitas enti- dades diferentes, a AC não é tão clara e os grupos formados na Classificação não são tão homogéneos como pretendido. Para ultrapassar esta limitação seria necessário um conjunto de dados com notícias que tivessem um número razoavelmente elevado de entidades semelhantes.

Capítulo 4

Segredos da Maçonaria Portuguesa

Este capítulo é dedicado ao estudo do livro ‘Segredos da Maçonaria Portuguesa’ a partir das entidades extraídas de cada parágrafo. Tal como no capítulo anterior, os softwares a utilizar para o efeito são o Dtm-Vic e o SPSS Statistics. Apresenta-se também uma comparação dos resultados com aqueles obtidos por uma abordagem de redes sociais a este conjunto de dados.

4.1

Descrição e análise dos dados

O conjunto de dados a estudar é constituído por 13971 referências às 5612 entidades presentes nos 2508 parágrafos analisados. A extração de entidades foi realizada a partir do livro digitalizado, o que faz com que apareçam entidades escritas de forma irregular. Logo no primeiro parágrafo aparece a entidade ‘Km Segredos da Maçonaria Portuguesa’ — ‘K’ na realidade é um ‘E’. No entanto, o livro digitalizado não impede a análise pois caso apareça alguma entidade deste género, conhece- se, geralmente, o seu significado. O processo de extração segue as mesmas regras descritas no Capítulo 3, Secção 3.2.

4.1.1

Análise de Correspondências

Como a ferramenta Visutex, utilizada no Capítulo 3, tem uma limitação de 1000 textos, utilizou-se uma ferramenta semelhante denominada de Visuresp que tem um limite de 30000 textos. Basicamente o software considera as entidades como respostas a cada parágrafo e por isso foi possível adaptar o conjunto de dados. Esta ferramenta também fornece algumas informações sobre o conteúdo dos dados e ainda

Começou-se por analisar quais as entidades a manter, ou seja, aquelas que são mais frequentes. Após a análise de algumas frequências, optou-se por reter aquelas entidades que apresentam uma frequência igual ou superior a 25. Assim, mantiveram-se 3844 citações das 57 entidades. Como já foi referido, o programa apenas considera 20 caracteres nas entidades, cortando as restantes letras. Neste caso também foi possível decifrar quais as letras que faltavam e continuar a análise. As entidades retidas apresentam-se na Tabela 4.1 e verifica-se que as frequências das mesmas variam entre 25 e 423. Pode-se observar que a entidade que aparece mais vezes é ‘GOL’. Assim, a tabela de contingência1 cruza 23302 parágrafos com 57 entidades.

Tabela 4.1: Entidades retidas e respetivas frequências

Entidades Frequência Entidades Frequência Abel*Pinheiro 37 Lisboa 177 António*Arnaut 25 Loja*Mercúrio 25 António*José*Vilela 70 Loja*Universalis 25 António*Reis 78 Maçonaria 49 Bairro*Alto 29 Mercúrio 27 CO 37 Mário*Martin*Guia 27 Carbonária 38 NUIPC 26 Cf 125 Nuno*Vasconcellos 47 Coimbra 33 Ongoing 30 Conselho*da*Ordem 45 PS 63 EUA 25 PSD 50 GLLP 204 Paulo*Portas 28 GLRP 322 País 32 GOL 423 Porto 46 Governo 40 Portugal 89 Grande*Dieta 144 Presidente 39 Grande*Loja 37 presidente 32 Grande*Loja*Legal*de*Portugal 25 Público 29 Grande*Loja*Regular*de*Portugal 33 Representante 96 Grande*Oriente*Lusitano 125 Sábado 68 Grão 64 secretário 50 grão-mestre 154 secretário*de*Estado 25 grão-mestre*do*GOL 30 SIED 28 Irmão 48 SIS 31 Irmãos 207 Silva*Carvalho 33

Isaltino*Morais 32 TDLSB 27 Jorge*Silva*Carvalho 57 Venerável 61

José*Moreno 35 Vice 27

Justiça 35

Após a AC, e para posteriormente aplicar a Análise Classificatória, é necessário identificar o número de eixos a reter. Ao utilizar o critério de Pearson retêm-se 38 eixos que explicam 81,11% da inércia total (ver Tabela 4.2). No entanto, atendendo a que o software não ‘guarda’ mais do que 30 coordenadas, essenciais para aplicar a Análise Classificatória no programa SPSS, optou-se por reter os 30 eixos que explicam 68,80% da inércia total. Esta percentagem de inércia já é aceitável pois, como já foi referido no capítulo anterior, deve manter-se um número suficiente de eixos de modo a explicar uma proporção de inércia superior a 50% (Naito, 2007), o que se verifica para 30 eixos. Pela tabela, pode constatar-se que os valores próprios são baixos. Isto deve-se à existência de muitas entidades diferentes no conjunto dos parágrafos.

Tabela 4.2: Valores próprios, inércia e inércia acumulada para os 38 primeiros eixos. Eixo λ Inércia (%) % acumulada Eixo λ Inércia (%) % acumulada 1 0,8953 3,32 3,32 20 0,5479 2,03 50,29 2 0,8597 3,19 6,51 21 0,5418 2,01 52,30 3 0,8199 3,04 9,56 22 0,5300 1,97 54,27 4 0,7719 2,86 12,42 23 0,5209 1,93 56,20 5 0,7596 2,82 15,24 24 0,5061 1,88 58,08 6 0,7400 2,75 17,99 25 0,5034 1,87 59,95 7 0,7232 2,68 20,67 26 0,4972 1,85 61,80 8 0,7043 2,61 23,29 27 0,4813 1,79 63,58 9 0,6850 2,54 25,83 28 0,4767 1,77 65,35 10 0,6660 2,47 28,30 29 0,4727 1,75 67,11 11 0,6539 2,43 30,73 30 0,4548 1,69 68,80 12 0,6230 2,31 33,04 31 0,4419 1,64 70,44 13 0,6110 2,27 35,31 32 0,4358 1,62 72,05 14 0,6082 2,26 37,57 33 0,4276 1,59 73,64 15 0,5937 2,20 39,77 34 0,4164 1,55 75,19 16 0,5843 2,17 41,94 35 0,4081 1,51 76,70 17 0,5742 2,13 44,07 36 0,4033 1,50 78,20 18 0,5700 2,12 46,19 37 0,3954 1,47 79,66

Recordando que o objetivo neste capítulo é estudar, principalmente, as entidades do livro, não teria grande interesse analisar quais os parágrafos que separam melhor os eixos. O que se pretende é identificar quais as entidades que o fazem e como con- tribuem para a formação de cada um dos eixos. Desta forma, a análise seguinte será realizada apenas tendo em consideração as entidades. Irá analisar-se a localização das suas coordenadas e as suas contribuições, tanto relativas como absolutas. Este estudo só será feito para os eixos 1, 2 e 3 a título ilustrativo.

Primeiro eixo principal

A percentagem de inércia explicada pelo primeiro eixo é de 3,32%. A entidade que mais contribui para a formação deste eixo é ‘Vice’, com coordenada positiva no eixo, com uma contribuição absoluta de 97,4 e uma contribuição relativa de 0,99. Como é de esperar, as outras entidades têm uma importância muito baixa neste eixo. Pelo plano [1,2] representado na Figura 4.1 vê-se realmente que a entidade ‘Vice’ está muito afastada das restantes, com coordenada positiva. Assim, este eixo é completamente explicado pela entidade ‘Vice’. Como não se retira nenhuma informação relevante a partir desta entidade, decidiu-se retirá-la da análise pois é um outlier. Sem esta entidade, a percentagem de inércia e os valores próprios alteram ligeiramente (ver Tabela M.1). Assim, a percentagem explicada pelo primeiro eixo é de 3,30%. Opõe as entidades ‘GLRP’3, ‘NUIPC’4 e ‘TDLSB’5, com coordenadas

negativas, às entidades ‘Grande Dieta’ e ‘Representante’ com coordenadas positivas. Todas elas estão bem representadas no plano pois apresentam uma CTR acima da média. As entidades do lado positivo do eixo contribuem mais para a sua formação — ‘Representante’ com uma contribuição absoluta de 58,2 e ‘Grande Dieta’ com 20,5 (Tabela N.1) como se pode ver pelo plano [1,2] da Figura 4.2.

Segundo eixo principal

O segundo eixo explica 3,14% da variabilidade total e separa entidades como ‘NUIPC’, ‘Nuno Vasconcellos’, ‘Ongoing’, ‘Representante’, ‘Silva Carvalho’ e ‘TDLSB’ com coordenadas positivas, de entidades como ‘GLLP’6 e ‘GLRP’, com coordenadas ne- gativas. Todas elas estão bem representadas. Na Tabela N.2 podem identificar-se estas entidades e respetivas contribuições.

Figura 4.1: En tidades retidas do livro represen tadas no plano [1,2].

4.2: En tidades retidas do livro, ap ós a exclusão da en tidade ‘Vice’, rep re sen tadas no plano [1,2].

Terceiro eixo principal

O terceiro eixo explica 2,96% da inércia e opõe as entidades ‘Carbonária’, ‘Lis- boa’, ‘Presidente’, ‘Venerável’ e ‘presidente’, com coordenadas positivas, às entida- des ‘GLLP’, ‘GLRP’, ‘Grande Loja’, ‘Grão’ e ‘Mário Martin Guia’, com coordenadas negativas. Através da Tabela N.3 e do plano [1,3] da Figura 4.4 é possível analisar a proximidade entre estas entidades e respetivas contribuições.

Figura 4.3: Quadro resumo - Eixos 1, 2 e 3.

4.1.2

Análise Classificatória

Nesta secção realizar-se-á o agrupamento das 57 entidades retidas em classes através da Classificação Hierárquica e Não Hierárquica. O objetivo é identificar grupos de entidades e descobrir se esses grupos são semelhantes ou não aos grupos formados a partir das redes sociais. As variáveis a utilizar serão as coordenadas nos 30 eixos fatoriais retidos.

Classificação Hierárquica

Utilizando como medidas o quadrado da distância Euclideana e o índice de Ward, aplicou-se uma classificação hierárquica ascendente e obteve-se o dendrograma da Figura 4.6. No dendrograma visualiza-se uma partição em duas classes. Uma delas contém duas entidades — ‘NUIPC’ e ‘TDLSB’ e a outra as restantes. Esta partição separa as entidades relacionadas com questões legais de todas as outras. No entanto, a primeira classe com 54 entidades pode ser dividida em mais classes e, por isso, decidiu-se calcular a inércia intra-classes e a inércia explicada7 para determinar qual

o corte adequado a fazer. Através da inércia intra-classes é possível desenhar um gráfico que permite ver a curva para as partições de 2 até 30 classes apresentado na Figura 4.5. Não é claro o ponto onde se observa o ‘cotovelo’ por isso optou-se por analisar a partição 15 pois apresenta um valor de inércia explicada relevante de

Figura 4.4: En tidades retidas do livro represen tadas no plano [1,3].

Figura 4.5: Inércia intra-classes para as partições de 2 até 30 classes. Tabela 4.3: Inércia explicada para as partições de 2 até 30 classes. No de classes Inércia explicada No de classes Inércia explicada

2 0,070193172 17 0,647197899 3 0,120001132 18 0,675944503 4 0,168743628 19 0,704640612 5 0,216139175 20 0,730457282 6 0,258780201 21 0,754885945 7 0,301124383 22 0,778083796 8 0,342427956 23 0,798864694 9 0,380907564 24 0,819035705 10 0,418831669 25 0,836912501 11 0,456692525 26 0,853798271 12 0,492466393 27 0,870038082 13 0,526474685 28 0,885481285 14 0,557480148 29 0,897532932 15 0,588360736 30 0,90901608 16 0,618277147

Na partição em 15 classes (ver Tabela O.1), é formado um grupo com as enti- dades ‘Grande Loja Legal de Portugal’ e ‘Grande Loja Regular de Portugal’. Estas entidades dizem respeito à única organização maçónica portuguesa internacional- mente reconhecida como Regular. Um outro grupo é formado pelas entidades ’Loja

Represen tação atra v és de um dendrograma d a classificação hierárquica ascenden te aplicada às 57 en tidades p elas 30 co ordenadas fatoriais.

Uma outra classe que se identificou inclui as entidades ‘Jorge Silva Carvalho’, ‘SIS’8 e ‘SIED’9. Jorge Silva Carvalho exerceu funções dirigentes na SIS e na SIED.

Outro dos grupos obtidos inclui as entidades ‘TDLSB’ e ‘NUIPC’. O significado destas siglas sugere que este grupo está associado a questões legais. As entidades ‘Nuno Vasconcellos’, ‘Ongoing’ ‘Silva Carvalho’ também surgiram como uma classe. Silva Carvalho integrou os quadros da empresa Ongoing Strategy Investments onde Nuno Vasconcellos é o presidente. Nesta partição encontram-se grupos muito peque- nos, alguns apenas com uma entidade, e um grupo muito grande com 31 entidades. Parece não existir uma estrutura classificatória forte nestes dados, pois as classes claramente definidas por temas são classes pequenas, i.e., com poucas entidades. De facto, há algumas entidades que se destacam das outras, formando as tais classes pe- quenas e agrupando as restantes numa mesma classe. Estas classes são também são visíveis no dendrograma obtido, onde não existem grandes grupos bem destacados, e parece até ocorrer um efeito de cadeia. Assim, decidiu-se analisar uma partição mais pequena (com 4 classes) para detetar grupos maiores e identificar qual a re- lação entre as entidades dessas classes (ver Tabela O.2). Obtém-se 4 classes, duas com 3 entidades (‘Abel Pinheiro’, ‘Paulo Portas’, ‘EUA’ e ‘Carbonária’, ‘presidente’, ‘Presidente’), uma com 2 entidades (‘Grande Loja Legal de Portugal’, ‘Grande Loja Regular de Portugal’) e outra com as restantes. Mais uma vez surge uma classe com muitas entidades e classes pequenas o que reforça uma vez mais que não existe uma estrutura de classes bem definida nestes dados. A classe 1 da partição em 4 classes é igual à obtida na partição em 15 classes e a classe 4 é igual à 7. A classe 3, com 3 entidades, foi dividida em 3 classes na partição em 15 classes. Assim, com o aumento do número de classes, as entidades do grupo grande vão sendo divididas em grupos mais pequenos, mantendo-se sempre uma classe com muitas entidades relativamente às restantes. Este efeito deve-se ao facto das entidades analisadas serem todas muito semelhantes, i.e., são todas sobre o mesmo tema em geral — maçonaria portuguesa. Por isso, torna-se difícil obter classes com muitas entidades e bem definidas por temas.

Classificação Não Hierárquica • K-médias

Aplicou-se a classificação não hierárquica através do algoritmo K-médias para K=2,...,K=30 tal como foi feito na classificação hierárquica. Para estudar qual a partição adequada, calculou-se a inércia explicada apresentada na Tabela 4.4.

Tabela 4.4: Inércia explicada para as partições 2 até 30 classes. No de classes Inércia explicada No de classes Inércia explicada

2 0,045695951 17 0,613567593 3 0,088073397 18 0,660967893 4 0,158435196 19 0,682608425 5 0,168425973 20 0,675334247 6 0,237055223 21 0,717774142 7 0,27947146 22 0,708317604 8 0,284888231 23 0,73342323 9 0,355040699 24 0,763844864 10 0,389692009 25 0,809353063 11 0,420443998 26 0,82207046 12 0,450953765 27 0,845353239 13 0,480058394 28 0,874782672 14 0,509375657 29 0,886442511 15 0,538213604 30 0,889801545 16 0,56436181

Verificam-se duas quebras do valor da inércia explicada — na partição 20 e na partição 22, o que sugere que as partições 19 e 21 (ver Tabelas P.1 e P.2) separam melhor as classes. De facto, estas partições têm um valor de inércia explicada de, aproximadamente, 0,6826 e 0,71777, respetivamente, o que já são valores relevantes. Nestas partições identificam-se dois grupos semelhantes aos obtidos na classificação hierárquica com as entidades:

- ‘NUIPC’ e ‘TDLSB’;

- ‘Grande Loja Legal de Portugal’ e ‘Grande Loja Regular de Portugal’.

Tal como na classificação hierárquica existem muitos grupos pequenos à exceção de um que contém 34 (partição em 19 classes) e 33 (partição em 21 classes) entidades. Como já se observou anteriormente, o aumento do número de classes iria fazer com que o grupo se dividisse. No entanto, iria continuar a existir um grupo com muitas entidades relativamente aos restantes formados. Por isso, decidiu-se também analisar a partição em 4 classes (Tabela P.3). As entidades ‘NUIPC’ e ‘TDLSB’ foram agrupadas numa classe. Ainda se observam duas classes com apenas uma entidade — uma com ‘António Arnaut’ e outra com ‘presidente’. A outra classe contém as restantes 52 entidades. Tal como na Classificação Hierárquica, existe sempre uma classe com bastantes entidades e muitas classes pequenas.

Figura 4.7: Mapa de K ohonen (3 x 3) represen tando as 56 en tidades do livro.

Apesar de não ser possível identificar temas específicos, estas classes maiores per- mitem observar quais as entidades que se assemelham mais entre si. Neste mapa, ainda aparece uma classe com apenas uma entidade — ‘Cf’. Esta entidade não está associada às restantes pois, apesar de aparecer algumas vezes no texto, não se trata realmente de uma entidade. O aparecimento de falsas entidades deve-se ao facto do algoritmo que extrai as entidades apresentar uma precisão superior a 95% mas inferior a 100%.

No mapa 4x4 (Anexo Q) já começam a surgir classes mais pequenas em contraste com uma classe com mais entidades. Apesar de se saber que o aumento do número de classes origina a formação de classes mais pequenas, decidiu-se analisar os mapas 5x5 e 6x6 10 para perceber alguns dos temas inerentes à maçonaria portuguesa. Estes

mapas estão apresentados no Anexo Q. A visualização dos dois mapas permite observar que têm duas classes em comum. Uma deles inclui as entidades ‘TDLSB’ e ‘NUIPC’, classe esta também obtida na classificação hierárquica. As entidades ‘Jorge Silva Carvalho’, ‘SIS’ e ‘SIED’ também pertencem à mesma classe em ambos os mapas. Jorge Silva Carvalho exerceu funções dirigentes na SIS e na SIED tal como foi referido na classificação hierárquica. A classe 2 do mapa 5x5 é constituído pelas entidades ‘Silva Carvalho’, ‘Ongoing’, ‘Nuno Vasconcellos’ e ‘CO’. À excepção da entidade ‘CO’, esta classe já foi identificada na Classificação. Como já vimos, Nuno Vasconcellos é o presidente da Ongoing Strategy Investments e Silva Carvalho integrou os quadros desta empresa onde assumiu diversos cargos de administração. A classe 3 do mapa 5x5 parece estar associado ao Governo pois inclui as entidades ‘Representante’, ‘PSD’, ‘PS’ e ‘Governo’. Mais uma vez a entidade ‘Isaltino Morais’ aparece associada à entidade ‘Loja Mercúrio’ na classe 6 do mapa 5x5. Esta classe também inclui a entidade ‘Grão’ neste mapa enquanto que no mapa 6x6 só inclui as primeiras duas entidades referidas. As entidades ‘Grande Loja Legal de Portugal’ e ‘Grande Loja Regular de Portugal’ aparecem na classe 5 do mapa 6x6. Observa-se também uma classe (classe 6) constituída pelas entidades ‘Porto’ e ‘Coimbra’ no mapa 6x6. A classe acerca do Governo parece dividir-se e gerar duas sub-classes — um constituído pelas entidades ‘País’, ‘PS’ e ‘Governo’ (classe 8) e outro constituído pelas entidades ‘secretário de Estado’ e ‘PSD’ (classe 9). No mapa 6x6, a classe 14 é formada pelas entidades ‘grão-mestre’, ‘Representante’, ‘Mário Martin Guia’, ‘Mercúrio’, ‘Grande Dieta’, ‘GLRP’ e ‘GLLP’. Mário Martin Guia foi eleito como Grão-mestre perante uma assembleia da GLRP/GLLP. Na Figura 4.8 apresenta-se um quadro resumo com as classes identificadas nestes dois mapas.

De acordo com os resultados obtidos na Classificação, é possível observar que foi identificado um maior número de classes a partir dos mapas de Kohonen do que através dos resultados obtidos na classificação hierárquica e no algoritmo K-médias.

Figura 4.8: Classes relevantes obtidos a partir dos mapas de Kohonen 5x5 e 6x6 com as 56 entidades do livro.

Além disto, a partir do mapa 3x3 obtiveram-se algumas classes com mais entidades agrupadas o que permitiu ver a proximidade entre elas. Como já foi referido, não existe uma estrutura classificatória bem definida nestes dados e, por isso, torna-se difícil encontrar classes com um número relevante de entidades bem definidas por temas.

4.2

Discussão dos resultados

O objetivo nesta secção é analisar se os resultados obtidos neste trabalho comple- mentam aqueles obtidos através da aplicação de redes sociais, e/ou se apresentam alguma semelhança entre eles. É de notar que foram utilizadas abordagens diferentes e, por isso, não se pode comparar uma análise elaborada a partir de uma rede com a análise realizada através dos métodos da AC e Classificação pois as características e finalidades dos métodos são distintas. Assim, enquanto que neste trabalho se estu- dam as entidades mais frequentes no livro, na análise de redes sociais estudaram-se as entidades e as relações entre elas, i.e., a rede em estudo é formada pelos vértices, que são as entidades, e pelas ligações entre os vértices, que no caso do livro repre- sentam a co-ocorrência das duas entidades na mesma frase. Esta é logo à partida uma das razões para o aparecimento de alguns termos neste trabalho que não são mencionados na rede social. Termos como CO, Cf e Vice, que não são entidades tal como foram atrás definidas, aparecem com alguma frequência no livro mas não associados a outras entidades o que justifica o seu aparecimento neste trabalho mas não na análise da rede formada.

locais, como se denominou acima, e outra sobre o Governo. Comparando as enti- dades destas comunidades com as classes obtidas na Classificação, temos no grupo sobre a GOL as entidades ‘GOL’ e ‘Irmãos’ em comum, no segundo grupo as en- tidades ‘Porto’ e ‘Coimbra’ e no terceiro ‘PS’, ‘PSD’ e ‘Governo’. Neste trabalho, algumas das entidades das restantes três comunidades foram divididas em classes mais pequenas, e.g., ‘GLRP’ e ‘GLLP’ formam, muitas vezes, apenas uma classe.

Figura 4.9: As seis comunidades de maior dimensão obtidas através da aplicação de redes socais por Rocha et al. (2014).

Pode-se concluir que existem algumas semelhanças entre os dois estudos reali- zados, pois identificam-se três grupos com algumas entidades em comum. No en- tanto, esses grupos incluem mais entidades no estudo das redes, entidades essas que não aparecem na lista das mais frequentes no presente estudo, como ‘Pedro Pas- sos Coelho’, ‘Viseu’, ‘Macau’, ‘CDS’, ‘Universidade Lusófona’. Assim, estes estudos complementam-se entre si.

Capítulo 5

Conclusões

Neste capítulo apresentam-se as principais conclusões, limitações e perspetivas de desenvolvimento do presente trabalho.

5.1

Resultados

Nesta dissertação analisaram-se três conjuntos de dados textuais. O primeiro consti- tuído por 227 notícias, o segundo constituído pelas entidades dessas mesmas notícias e o terceiro com as entidades do livro ‘Segredos da Maçonaria Portuguesa’.

No primeiro conjunto de dados foram utilizadas 87 palavras para descrever o con- junto das notícias. Retiveram-se os primeiros 30 eixos da AC que explicam 70,11% da inércia total. Através do software Dtm-Vic, explorou-se a AC nos primeiros três