• Aucun résultat trouvé

Combinaison des approches directe et inverse pour caract´eriser la structure en

Dans le document The DART-Europe E-theses Portal (Page 186-200)

Conforme discutido anteriormente, as evoluções no esquema do cluster podem fazer com que as GSM entre a ontologia do cluster e as ontologias dos seus pontos tornem-se abaixo do limite de cluster . Essa situação torna o cluster semanticamente desbalanceado no nível intra-cluster. Baseado nisso, propomos a definição a seguir:

Definição 1: Seja Ci um cluster e Pi = {pi1, pi2, pi3, pi4,..., pik} um conjunto de pontos

pertencentes a Ci. Ci está balanceado semanticamente no nível intra-cluster se para

todo ponto pinPi, a GSM entre Opin e OCi for maior ou igual a . Assim, também

podemos definir que um cluster está semanticamente balanceado no nível intra- cluster, da seguinte forma:

pinPi | GSM(Opin, OCi) , Ci está semanticamente balanceado no nível

intra-cluster.

A Figura 4.1 ilustra dois clusters distintos C1 e C2 que são vizinhos

semânticos. Os círculos sem preenchimento representam os pontos pertencentes a um cluster. O círculo preenchido em escuro representa o líder do cluster. A linha contínua representa uma conexão intra-cluster e a tracejada a conexão inter-cluster. Os valores sobre as linhas contêm as GSM entre cada cluster (representado por seu líder) e seus pontos. Considerando um valor arbitrário de  igual a 0.7, podemos obervar que o C1 está semanticamente balanceado no nível intra-cluster. Todas as

C2apresenta um desbalanceamento semântico intra-cluster, uma vez que a GSM

entre OC2 e OY é igual a 0.69 (valor inferior a ).

Figura 4.1-Cluster balanceado (C1) e não balanceado (C2) no nível intra-cluster.

Há duas maneiras do desbalanceamento semântico intra-cluster ser atingido com a evolução da ontologia do cluster: pela entrada de um ponto no cluster ou pela evolução do esquema de um ponto já presente no cluster. Mais adiante explicaremos o porquê da saída do ponto não causar esse desbalanceamento. Para melhor entendermos como o desbalanceamento semântico intra-cluster pode ser atingido, vamos considerar o cenário descrito a seguir.

Considere um sistema que integra pontos, no domínio de Educação. Inicialmente, o sistema não dispõe de clusters já formados. A cada instante de tempo ti, um ponto qualquer solicita a sua entrada no sistema. Cinco pontos P1, P2, P3, P4 e

P5 possuem esquemas relacionados ao mesmo domínio de Educação. As ontologias

OP1 e OP2 estão ilustradas nas Figura 4.2 e Figura 4.3, respectivamente. As

ontologias OP3, OP4 e OP5 encontram-se no APÊNDICE A.

Figura 4.2- Ontologia de P1 – OP1 C1 0.70 0.75 0.83 C2 0.75 0.73 0.69 0.78 Y Líder de cluster Ponto Conexão intra-cluster Conexão inter-cluster

Fonte: o próprio Autor.

Figura 4.3- Ontologia de P2 – OP2.

Fonte: o próprio Autor.

A sucessão de entrada dos cinco pontos no sistema encontra-se descrita no Quadro 4.1, cujas colunas significam:

T- instante de tempo tn, no qual uma ação aconteceu no cluster; Ação- entrada ou evolução no esquema do ponto;

GSM- medida de similaridade semântica entre a ontologia de um ponto Pn e a

ontologia de C1, antes da entrada de Pn;

Evolução no Esquema do Cluster- forma na qual o esquema de C1, isto é sua

ontologia, evoluiu. Utilizamos a ferramenta de merge apresentada em PIRES et al. (2011), para atualizar OC1, nas ações de entrada e evolução dos esquemas do

ponto; e

Similaridades Intra-Clusters- valores de GSM entre cada OPn e OC1, após cada

ação ocorrida em C1.

Quadro 4.1-Medidas de similaridades semânticas (GSM) em função de ações dinâmicas dos pontos.

T Ação GSM Evolução no Esquema do Cluster

Similaridades

Intra-clusters

t1 entradaP1 Não calculada. OC1 = OP1 GSM(OP1, OC1) = 1.0

t2 entradaP2 GSM(O

P2, OC1) = 0.71 OC1 = merge(OC1, OP2)

GSM(OP1, OC1) = 0.84

GSM(OP2, OC1) = 0.92

t3 entradaP3 GSM(OP3, OC1) = 0.75 OC1 = merge(OC1, OP3)

GSM(OP1, OC1) = 0.75

GSM(OP2, OC1) = 0.85

GSM(OP3, OC1) = 0.85

t4 entradaP4 GSM(OP4, OC1) = 0.72 OC1 = merge(OC1, OP4) GSM(OP1, OC1) = 0.72

GSM(OP3, OC1) = 0.81

GSM(OP4, OC1) = 0.79

Fonte: o próprio Autor.

Podemos observar no Quadro 4.1 que, no instante de tempo t1, o ponto P1

entrou no sistema e formou seu próprio clusterC1. Como P1 é o único ponto do

cluster, a ontologia do cluster passa a ser a ontologia de P1 (OC1 = OP1). No instante t2,

P2 entrou no sistema e foi direcionado a C1(o único existente). A GSM entre OP2 e

OC1 é igual a 0.71 (acima de ). Neste caso, P2 entrará em C1 e o merge entre suas

ontologias é executado, provocando a evolução da OC1. A ontologia resultante do

merge entre OC1e OP2encontra-se ilustrada na F. Após esta evolução, as GSM foram

recalculadas. Podemos observar que, com a entrada de P2, a similaridade semântica

entre OP1e OC1 diminuiu de 1.0 para 0.84. Os novos elementos contidos em OP2

fizeram com que a similaridade entre OP1e OC1se distanciasse um pouco. Porém,

esse distanciamento não provocou um desbalanceamento intra-cluster. Considerando as informações descritas no Quadro 4.1, explicaremos, através de exemplos, a relação entre as ações do ponto que implicam na evolução no esquema do cluster e, consequentemente, desencadeiam um desbalanceamento semântico intra-cluster.

Figura 4.4- Ontologia de C1 resultante do merge entre OC1 e OP2.

Fonte: o próprio Autor.

Para entendermos como a entrada de um ponto pode causar o desbalanceamento semântico intra-cluster, vamos considerar a formação do clusterC1, de acordo com o Quadro 4.1. Até o instante t4, C1 encontra-se

semanticamente balanceado no nível intra-cluster, ou seja, todas as GSM estão acima de . Em um instante de tempo ti, P5 entra no sistema e a GSM entre a

ontologia de P5 (ontologia ilustrada pela Figura 4.5) e OC1 é igual a 0.7. Logo, P5

entra em C1 e todas as GSM são recalculadas, conforme mostra o Quadro 4.2.

Figura 4.5- Ontologia de P5 – OP5.

Fonte: o próprio Autor.

Após a entrada de P5, os valores das GSM(OP1,OC1) e GSM(OP4,OC1)

diminuíram de 0.72 e 0.79 para 0.6 e 0.69, respectivamente. Portanto, a ação de entrada de P5 provocou um desbalanceamento semântico intra-cluster.

Quadro 4.2- Similaridades semânticas intra-cluster após a entrada de P5.

T Ação GSM Evolução no Esquema do Cluster Similaridades Intra-clusters ti entradaP5 GSM(OP5, OC1) = 0.7 O(C1) = merge(OC1, OP5) GSM(O(P1), O(C1)) = 0.6 GSM(O(P2), O(C1)) = 0.71 GSM(O(P3), O(C1)) = 0.7

GSM(O(P4), O(C1)) = 0.69

GSM(O(P5), O(C1)) = 0.85

Fonte: o próprio Autor.

o Desbalanceamento intra-cluster devido à evolução no esquema do ponto

Para entendermos como a evolução da ontologia do ponto pode provocar um desbalanceamento semântico intra-cluster, voltamos a considerar a situação descrita no Quadro 4.1 (após o tempo t4). Suponha que a OP2evoluiu em um tempo tj. A

evolução consistiu na adição do conceito Project, com as propriedades projectTitle e hasMember (uma relação com Person). Além disso, foi adicionada a propriedade headProject em Faculty, representando a relação entre este último conceito e Project. A Figura 4.6 ilustra a OP2atualizada.

Figura 4.6- Ontologia do P2 evoluída.

Fonte: o próprio Autor.

Uma vez que OP2foi atualizada, OC1 precisa ser atualizada a fim de refletir as

mudanças no esquema de P2. Assim, o merge entre OC1 e OP2 é executado e as GSM

que a GSM entre OP1e OC1 diminui de 0.72 para 0.69, o que constata o

desbalanceamento semântico no nível intra-cluster, devido à evolução do esquema do ponto.

Quadro 4.3- Similaridades semânticas após a evolução de OP2.

T Ação Dinâmica GSM Evolução no Esquema do Cluster Similaridades Intra-clusters tj evoluçãoOP 2

Não calculada, pois o ponto já faz parte do clusterC1. OC1 = merge (OC1, OP2) GSM(OP1, OC1) = 0.69 GSM(OP2, OC1) = 0.78 GSM(OP3, OC1) = 0.78 GSM(OP4, OC1) = 0.76

Fonte: o próprio Autor.

o Considerações sobre a saída de um ponto

Para manter a representação dos esquemas dos seus pontos, com a saída de um ponto, o cluster deverá remover apenas os elementos exclusivos do esquema desse ponto de seu esquema. Deste modo, a esquema do cluster poderá ser atualizado. Essa remoção é uma operação inversa ao merge a qual chamamos de “unmerge”.

Apesar da saída de um ponto provocar evolução no esquema do cluster, um desbalanceamento intra-cluster não é atingido. A saída de um ponto requer a execução do “unmerge” entre a ontologia do ponto que está deixando o cluster e a ontologia do cluster. Neste caso, a GSM entre a ontologia de cada ponto que permaneceu no cluster e a ontologia do cluster poderá manter-se a mesma ou aumentar. Para entendermos a razão disso, voltemos a considerar a situação descrita no Quadro 4.1 (após o tempo t4). Em um tempo tk, P4 saiu do cluster. A ontologia de

Figura 4.7- Ontologia do ponto P4 - OP4.

Fonte: o próprio Autor.

Dentre as demais ontologias dos pontos P1, P2, P3 e P4, os conceitos

Periodical e UnofficialPublication fazem parte, exclusivamente, de OP4. Portanto,

com a saída de P4 de C1, o “unmerge” removerá esses conceitos de OC1. A Figura

4.8 ilustra duas ontologias de C1, em diferentes momentos. A Figura 4.8 (a) ilustra

OC1 antes da saída de P4 e a Figura 4.8 (b) ilustra OC1 atualizada após a saída de P4.

Como houve modificação na OC1, devido à saída de P4, as GSM são

recalculadas e o Quadro 4.4 apresenta seus novos valores para os pontos que permaneceram no cluster.

Figura 4.8- Ontologia de C1 antes da saída de P4 (a) e após a saída de P4 (b).

(b) Ontologia de C1 após a saída de P4

Fonte: o próprio Autor.

Quadro 4.4- Evolução da ontologia do clusterC1 com a saída de P4.

T Ação Dinâmica GSM Evolução no Esquema do Cluster Similaridades Intra-clusters t4 entradaP4 GSM(OP4, OC1) = 0.72 OC1 = merge (OC1, OP4) GSM(OP1, OC1) = 0.72 GSM(OP2, OC1) = 0.81 GSM(OP3, OC1) = 0.81 GSM(OP4, OC1) = 0.79 tk saídaP4

Não calculada, pois o ponto esta saindo de C1. OC1 = unmerger(OC1, OP4) GSM(OP1, OC1) = 0.75 GSM(OP2, OC1) = 0.85 GSM(OP3, OC1) = 0.85

Fonte: o próprio Autor.

Pelo Quadro 4.4, podemos verificar que no tempo t4 houve a entrada de P4 em

C1 e foi realizado o merge entre OP4 e OC1. Os demais pontos de C1, por não terem

alguns dos conceitos da OP4, distanciaram-se semanticamente da OC1. Porém, com a

saída de P4, esses conceitos foram removidos da OC1. Logo, podemos constatar pelo

Quadro 4.4, que as GSM entre OP1, OP2 e OP3 com OC1 aumentaram de 0.72, 0.81 e

0.81 para 0.75, 0.85 e 0.85, respectivamente, após a saída de P4. Neste caso, OP1, OP2

e OP3 se aproximaram semanticamente de OC1. A ação de saída de um ponto

aumentou as GSM dos demais pontos que permaneceram no cluster. Portanto, a saída de um ponto não provocará um desbalanceamento semântico intra-cluster.

Dans le document The DART-Europe E-theses Portal (Page 186-200)