Conforme discutido anteriormente, as evoluções no esquema do cluster podem fazer com que as GSM entre a ontologia do cluster e as ontologias dos seus pontos tornem-se abaixo do limite de cluster . Essa situação torna o cluster semanticamente desbalanceado no nível intra-cluster. Baseado nisso, propomos a definição a seguir:
Definição 1: Seja Ci um cluster e Pi = {pi1, pi2, pi3, pi4,..., pik} um conjunto de pontos
pertencentes a Ci. Ci está balanceado semanticamente no nível intra-cluster se para
todo ponto pinPi, a GSM entre Opin e OCi for maior ou igual a . Assim, também
podemos definir que um cluster está semanticamente balanceado no nível intra- cluster, da seguinte forma:
pinPi | GSM(Opin, OCi) , Ci está semanticamente balanceado no nível
intra-cluster.
A Figura 4.1 ilustra dois clusters distintos C1 e C2 que são vizinhos
semânticos. Os círculos sem preenchimento representam os pontos pertencentes a um cluster. O círculo preenchido em escuro representa o líder do cluster. A linha contínua representa uma conexão intra-cluster e a tracejada a conexão inter-cluster. Os valores sobre as linhas contêm as GSM entre cada cluster (representado por seu líder) e seus pontos. Considerando um valor arbitrário de igual a 0.7, podemos obervar que o C1 está semanticamente balanceado no nível intra-cluster. Todas as
C2apresenta um desbalanceamento semântico intra-cluster, uma vez que a GSM
entre OC2 e OY é igual a 0.69 (valor inferior a ).
Figura 4.1-Cluster balanceado (C1) e não balanceado (C2) no nível intra-cluster.
Há duas maneiras do desbalanceamento semântico intra-cluster ser atingido com a evolução da ontologia do cluster: pela entrada de um ponto no cluster ou pela evolução do esquema de um ponto já presente no cluster. Mais adiante explicaremos o porquê da saída do ponto não causar esse desbalanceamento. Para melhor entendermos como o desbalanceamento semântico intra-cluster pode ser atingido, vamos considerar o cenário descrito a seguir.
Considere um sistema que integra pontos, no domínio de Educação. Inicialmente, o sistema não dispõe de clusters já formados. A cada instante de tempo ti, um ponto qualquer solicita a sua entrada no sistema. Cinco pontos P1, P2, P3, P4 e
P5 possuem esquemas relacionados ao mesmo domínio de Educação. As ontologias
OP1 e OP2 estão ilustradas nas Figura 4.2 e Figura 4.3, respectivamente. As
ontologias OP3, OP4 e OP5 encontram-se no APÊNDICE A.
Figura 4.2- Ontologia de P1 – OP1 C1 0.70 0.75 0.83 C2 0.75 0.73 0.69 0.78 Y Líder de cluster Ponto Conexão intra-cluster Conexão inter-cluster
Fonte: o próprio Autor.
Figura 4.3- Ontologia de P2 – OP2.
Fonte: o próprio Autor.
A sucessão de entrada dos cinco pontos no sistema encontra-se descrita no Quadro 4.1, cujas colunas significam:
T- instante de tempo tn, no qual uma ação aconteceu no cluster; Ação- entrada ou evolução no esquema do ponto;
GSM- medida de similaridade semântica entre a ontologia de um ponto Pn e a
ontologia de C1, antes da entrada de Pn;
Evolução no Esquema do Cluster- forma na qual o esquema de C1, isto é sua
ontologia, evoluiu. Utilizamos a ferramenta de merge apresentada em PIRES et al. (2011), para atualizar OC1, nas ações de entrada e evolução dos esquemas do
ponto; e
Similaridades Intra-Clusters- valores de GSM entre cada OPn e OC1, após cada
ação ocorrida em C1.
Quadro 4.1-Medidas de similaridades semânticas (GSM) em função de ações dinâmicas dos pontos.
T Ação GSM Evolução no Esquema do Cluster
Similaridades
Intra-clusters
t1 entradaP1 Não calculada. OC1 = OP1 GSM(OP1, OC1) = 1.0
t2 entradaP2 GSM(O
P2, OC1) = 0.71 OC1 = merge(OC1, OP2)
GSM(OP1, OC1) = 0.84
GSM(OP2, OC1) = 0.92
t3 entradaP3 GSM(OP3, OC1) = 0.75 OC1 = merge(OC1, OP3)
GSM(OP1, OC1) = 0.75
GSM(OP2, OC1) = 0.85
GSM(OP3, OC1) = 0.85
t4 entradaP4 GSM(OP4, OC1) = 0.72 OC1 = merge(OC1, OP4) GSM(OP1, OC1) = 0.72
GSM(OP3, OC1) = 0.81
GSM(OP4, OC1) = 0.79
Fonte: o próprio Autor.
Podemos observar no Quadro 4.1 que, no instante de tempo t1, o ponto P1
entrou no sistema e formou seu próprio clusterC1. Como P1 é o único ponto do
cluster, a ontologia do cluster passa a ser a ontologia de P1 (OC1 = OP1). No instante t2,
P2 entrou no sistema e foi direcionado a C1(o único existente). A GSM entre OP2 e
OC1 é igual a 0.71 (acima de ). Neste caso, P2 entrará em C1 e o merge entre suas
ontologias é executado, provocando a evolução da OC1. A ontologia resultante do
merge entre OC1e OP2encontra-se ilustrada na F. Após esta evolução, as GSM foram
recalculadas. Podemos observar que, com a entrada de P2, a similaridade semântica
entre OP1e OC1 diminuiu de 1.0 para 0.84. Os novos elementos contidos em OP2
fizeram com que a similaridade entre OP1e OC1se distanciasse um pouco. Porém,
esse distanciamento não provocou um desbalanceamento intra-cluster. Considerando as informações descritas no Quadro 4.1, explicaremos, através de exemplos, a relação entre as ações do ponto que implicam na evolução no esquema do cluster e, consequentemente, desencadeiam um desbalanceamento semântico intra-cluster.
Figura 4.4- Ontologia de C1 resultante do merge entre OC1 e OP2.
Fonte: o próprio Autor.
Para entendermos como a entrada de um ponto pode causar o desbalanceamento semântico intra-cluster, vamos considerar a formação do clusterC1, de acordo com o Quadro 4.1. Até o instante t4, C1 encontra-se
semanticamente balanceado no nível intra-cluster, ou seja, todas as GSM estão acima de . Em um instante de tempo ti, P5 entra no sistema e a GSM entre a
ontologia de P5 (ontologia ilustrada pela Figura 4.5) e OC1 é igual a 0.7. Logo, P5
entra em C1 e todas as GSM são recalculadas, conforme mostra o Quadro 4.2.
Figura 4.5- Ontologia de P5 – OP5.
Fonte: o próprio Autor.
Após a entrada de P5, os valores das GSM(OP1,OC1) e GSM(OP4,OC1)
diminuíram de 0.72 e 0.79 para 0.6 e 0.69, respectivamente. Portanto, a ação de entrada de P5 provocou um desbalanceamento semântico intra-cluster.
Quadro 4.2- Similaridades semânticas intra-cluster após a entrada de P5.
T Ação GSM Evolução no Esquema do Cluster Similaridades Intra-clusters ti entradaP5 GSM(OP5, OC1) = 0.7 O(C1) = merge(OC1, OP5) GSM(O(P1), O(C1)) = 0.6 GSM(O(P2), O(C1)) = 0.71 GSM(O(P3), O(C1)) = 0.7
GSM(O(P4), O(C1)) = 0.69
GSM(O(P5), O(C1)) = 0.85
Fonte: o próprio Autor.
o Desbalanceamento intra-cluster devido à evolução no esquema do ponto
Para entendermos como a evolução da ontologia do ponto pode provocar um desbalanceamento semântico intra-cluster, voltamos a considerar a situação descrita no Quadro 4.1 (após o tempo t4). Suponha que a OP2evoluiu em um tempo tj. A
evolução consistiu na adição do conceito Project, com as propriedades projectTitle e hasMember (uma relação com Person). Além disso, foi adicionada a propriedade headProject em Faculty, representando a relação entre este último conceito e Project. A Figura 4.6 ilustra a OP2atualizada.
Figura 4.6- Ontologia do P2 evoluída.
Fonte: o próprio Autor.
Uma vez que OP2foi atualizada, OC1 precisa ser atualizada a fim de refletir as
mudanças no esquema de P2. Assim, o merge entre OC1 e OP2 é executado e as GSM
que a GSM entre OP1e OC1 diminui de 0.72 para 0.69, o que constata o
desbalanceamento semântico no nível intra-cluster, devido à evolução do esquema do ponto.
Quadro 4.3- Similaridades semânticas após a evolução de OP2.
T Ação Dinâmica GSM Evolução no Esquema do Cluster Similaridades Intra-clusters tj evoluçãoOP 2
Não calculada, pois o ponto já faz parte do clusterC1. OC1 = merge (OC1, OP2) GSM(OP1, OC1) = 0.69 GSM(OP2, OC1) = 0.78 GSM(OP3, OC1) = 0.78 GSM(OP4, OC1) = 0.76
Fonte: o próprio Autor.
o Considerações sobre a saída de um ponto
Para manter a representação dos esquemas dos seus pontos, com a saída de um ponto, o cluster deverá remover apenas os elementos exclusivos do esquema desse ponto de seu esquema. Deste modo, a esquema do cluster poderá ser atualizado. Essa remoção é uma operação inversa ao merge a qual chamamos de “unmerge”.
Apesar da saída de um ponto provocar evolução no esquema do cluster, um desbalanceamento intra-cluster não é atingido. A saída de um ponto requer a execução do “unmerge” entre a ontologia do ponto que está deixando o cluster e a ontologia do cluster. Neste caso, a GSM entre a ontologia de cada ponto que permaneceu no cluster e a ontologia do cluster poderá manter-se a mesma ou aumentar. Para entendermos a razão disso, voltemos a considerar a situação descrita no Quadro 4.1 (após o tempo t4). Em um tempo tk, P4 saiu do cluster. A ontologia de
Figura 4.7- Ontologia do ponto P4 - OP4.
Fonte: o próprio Autor.
Dentre as demais ontologias dos pontos P1, P2, P3 e P4, os conceitos
Periodical e UnofficialPublication fazem parte, exclusivamente, de OP4. Portanto,
com a saída de P4 de C1, o “unmerge” removerá esses conceitos de OC1. A Figura
4.8 ilustra duas ontologias de C1, em diferentes momentos. A Figura 4.8 (a) ilustra
OC1 antes da saída de P4 e a Figura 4.8 (b) ilustra OC1 atualizada após a saída de P4.
Como houve modificação na OC1, devido à saída de P4, as GSM são
recalculadas e o Quadro 4.4 apresenta seus novos valores para os pontos que permaneceram no cluster.
Figura 4.8- Ontologia de C1 antes da saída de P4 (a) e após a saída de P4 (b).
(b) Ontologia de C1 após a saída de P4
Fonte: o próprio Autor.
Quadro 4.4- Evolução da ontologia do clusterC1 com a saída de P4.
T Ação Dinâmica GSM Evolução no Esquema do Cluster Similaridades Intra-clusters t4 entradaP4 GSM(OP4, OC1) = 0.72 OC1 = merge (OC1, OP4) GSM(OP1, OC1) = 0.72 GSM(OP2, OC1) = 0.81 GSM(OP3, OC1) = 0.81 GSM(OP4, OC1) = 0.79 tk saídaP4
Não calculada, pois o ponto esta saindo de C1. OC1 = unmerger(OC1, OP4) GSM(OP1, OC1) = 0.75 GSM(OP2, OC1) = 0.85 GSM(OP3, OC1) = 0.85
Fonte: o próprio Autor.
Pelo Quadro 4.4, podemos verificar que no tempo t4 houve a entrada de P4 em
C1 e foi realizado o merge entre OP4 e OC1. Os demais pontos de C1, por não terem
alguns dos conceitos da OP4, distanciaram-se semanticamente da OC1. Porém, com a
saída de P4, esses conceitos foram removidos da OC1. Logo, podemos constatar pelo
Quadro 4.4, que as GSM entre OP1, OP2 e OP3 com OC1 aumentaram de 0.72, 0.81 e
0.81 para 0.75, 0.85 e 0.85, respectivamente, após a saída de P4. Neste caso, OP1, OP2
e OP3 se aproximaram semanticamente de OC1. A ação de saída de um ponto
aumentou as GSM dos demais pontos que permaneceram no cluster. Portanto, a saída de um ponto não provocará um desbalanceamento semântico intra-cluster.