• Aucun résultat trouvé

4. HIGH TEMPERATURE OXIDATION

4.1. Experimental procedures and setups

4.1.4. MTA EK

Em (MATELLI; BAZZO, 2006) é apresentado um protótipo inicial de um sistema especialista (PISE) para o projeto e a otimização de sistemas de cogeração a gás natural. O (PISE) apresentado é implementado em um “shell” e tem a base de conhecimento baseada em regras.

Tabela 3.4: Sistemas Especialistas na área médica. Nome Medicina

PUFF Diagnóstico de doenças pulmonares

VM Monitoramento de pacientes com cuidados intensivos AI/COAG Diagnóstico de doenças sanguíneas

AI/RHEUM Diagnóstico de doenças reumatóides CADUCEUS Diagnóstico de doenças na clínica médica ANNA Monitoramento de terapia digital

BLUE BOX Diagnóstico e tratamento da depressão MYCIN Diagnóstico e tratamento de infecções

ONCOCIN Tratamento e gerenciamento de pacientes submetidos a qui- mioterapia

ATTENDING Instrução no gerenciamento de anestégicos GUIDON Instrução em infecções bacterianas

Tabela 3.5: Sistemas Especialistas na área de engenharia. Nome Engenharia

REACTOR Diagnóstico e tratamento de acidentes em reatores nuclea- res

DELTA Diagnóstico e tratamento de falhas em locomotivas a diesel STEAMER Instrução utilizando simulações para operação do vapor de

uma usina elétrica

Tabela 3.6: Sistemas Especialistas na área de geologia.

Nome Geologia

DIPMETER Interpreta logs do dipmeter

LITHO Interpreta registros dos dados de poços de petróleo MUD Diagnóstico e tratamento com problemas de prospecção PROSPECTOR Interpreta dados geológicos para minerais

Na implementação o meio significa a base de conhecimento, a saída é uma conclu- são alcançada por determinada regra e a entrada são as possíveis variáveis que estão na memória de trabalho que provocam o disparo das regras. Um exemplo de como pode funcionar está apresentado na figura 3.1.

Em Victor (2005), é apresentado um sistema especialista baseado em regras de produ- ção implementado em LabView para detecção de falhas em circuitos de comandos de um sistema de acionamento e comandos de motores elétricos conhecido como Partida Direta. A construção das regras é determinada através de uma consulta realizada a um especia- lista humano, onde são informados os possíveis diagnósticos para cada falha observada.

3.1. TRABALHOS CLÁSSICOS DE SISTEMAS ESPECIALISTAS 39

Figura 3.1: Regras para Cogeração de Energia (MATELLI; BAZZO, 2006).

A figura 3.2a apresenta a estrutura do sistema especialista. O seletor de regras e as conclu- sões são definidas a partir de dados apresentados na figura 3.3. Na figura 3.2b o módulo do sistema é apresentado, possibilidade de construir novas regras indicando inclusive o grau de confiança da resposta.

Figura 3.2: Sistema Especialista para Detecção de Falhas em Comandos Elétricos (VIC- TOR, 2005).

(a) Estrutura do Sis- tema Especialista

(b) Módulo do Sis- tema Especialista

O Expert SINTA (NOGUEIRA et al., 1996), desenvolvido pelo LIA (Laboratório de Inteligência Artificial) da UFC, é um exemplo de Shell desenvolvida para a criação de Sis- temas Especialistas que utilizam um modelo de representação do conhecimento baseado em regras de produção e probabilidades. Shell é um interpretador que tem como objetivo a simplificação do trabalho na implementação de algum sistema.

O SINTA é um shell que tem como finalidade a construção de sistemas especialistas baseados em regras. Para isso é necessário apenas que seja criado uma base de conheci-

Figura 3.3: Regras do SPED (VICTOR, 2005).

mento no formato de regras pois o motor de inferência já está definido.

O SECAJU é um sistema simples de diagnóstico de pragas e doenças do cajueiro utilizando shell do expert SINTA. Através de perguntas dirigidas ao responsável pela plantação, uma série de prováveis pragas e doenças é apresentada ao final de uma con- sulta (NOGUEIRA et al., 1996).

Capítulo 4

Metodologia

Um sistema baseado em regras foi desenvolvido para analisar aspectos de uma planta industrial simulada. A planta é colocada sob determinadas situações com o propósito de analisar seus comportamentos. A metodologia proposta é realizada em duas etapas: Na primeira, são analisadas as variáveis que são mais sensibilizadas devido as atuações na planta, utilizando um classificador online conhecido como TEDA-Cloud. Em um se- gundo momento são construídas as regras lógicas que descrevem esses comportamentos, utilizando para isso a técnica CILP (Connectionist Inductive Learning and Logic Pro- gramming).

Nos capítulos anteriores são evidenciados as técnicas existentes para representação do conhecimento. Entretanto, a maioria dessas técnicas necessitam que uma informação privilegiada sobre o processo seja inserido diretamente sobre a perspectiva de um especi- alista. Neste capítulo é apresentado o modelo de como organizar as regras lógicas e como adquirir informações sobre uma planta industrial sem necessidade de compreensão ampla do processo estudado.

Com isso, a metodologia privilegia o estudo de processos sobre os quais pouca ou nenhuma informação é previamente adquirida. Desta forma, as regras adquiridas devem abordar os padrões atuais que estejam ocorrendo. O processo utilizado é uma simulação de um benchmark relacionado com o processo do Tennessee Eastman (TE). Este processo trata de um problema real na indústria química e foi apresentado por (DOWNS; VOGEL, 1993). É uma simulação que não apresenta os produtos e subprodutos explicitamente, mas mesmo assim é amplamente utilizado literatura. Kenett (2017) considera o simulador do (TE) como um dos mais complexos simuladores, sugerindo seu uso para aplicações avançadas na graduação ou cursos avançados de estatística.

4.1

CILP

O sistema CILP utiliza a estrutura de uma rede neural feedforward N para descrever um programa lógico P. O algoritmo descreve uma maneira automática de como calcular os pesos, o bias e a estrutura da rede. Desta forma, o conhecimento atual do modelo é definido anteriormente às regras que os especialistas conhecem sobre o processo. Um refinamento da rede é possível desde que as regras sejam parcialmente conhecidas.

Um programa lógico é um conjunto de cláusulas no formato sendo os literais rl :

L1, L2, . . . Lk→ Alsendo Li(1 ≤ i ≤ k) os literais e A o átomo que representa a conclusão

da cláusula (Lloyd, 1987). Nesse formato L1, L2, . . . Lk integram o corpo e Al a cabeça

da cláusula (HöLLDOBLER; KALINKE, 1994).

Portanto, a partir do programa P é necessário definir além da estrutura da rede, os pe- sos sinápticos e valores dos bias para cada neurônio da rede N. Para isso, são introduzidos alguns conceitos (GARCEZ; BRODA; GABBAY, 2012):

• Amin: Menor valor de ativação para que o neurônio seja considerado ativo. Amin∈

(0, 1).

• Amax: Maior valor de ativação para que o neurônio seja considerado inativo. Amax∈

(−1, 0).

• h(x) = 2/(1 + eβx) − 1: Função de ativação semilinear bipolar.

• g(x) = x: Função de ativação linear.

• W e −W : Representam os pesos das conexões associados a uma cláusula rl. Sendo

W para os pesos em que os literais estão positivamente conectados e −W represen- tando uma conexão em que o literal está no formato de negação ¬Li.

• θl: Bias dos neurônios localizados na camada oculta.

• θA: Bias dos neurônios localizados na camada de saída.

• kl: Representa o número de literais no corpo da cláusula rl.

• pl: Representa o número de literais positivos no corpo da cláusula rl.

• µl: Representa o número de cláusulas em P com o mesmo átomo da cabeça da

cláusula rl.

• MAXrl(kl, µl): : Representa o maior elemento entre kl e µl para a cláusula rl.

MAXP(k1, ..., kq, µ1, ..., µq): Representa o maior elemento entre todos os kl e µl do

programa lógico P.

Desse modo pode-se calcular o valor de Amin como sendo qualquer quantidade que

4.2. TEDA 43

Amin> MAXP− 1

MAXP+ 1 (4.1)

Sabendo que a MAXP é um valor no mínimo igual a um, conclui-se que Amin∈ (0, 1).

Por definição, Amaxé apresentado como sendo −Amin. Utilizando essa metodologia, a rede

neural não apresentará valores no intervalo (−Amax, Amin) (Garcez, Broad and Gabbay,

2002).

W > 2 β

ln(1 + Amin) − ln(1 − Amin)

MAXP(Amin− 1) + Amin+ 1

(4.2) θl= (1 + Amin)(kl− 1) 2 W (4.3) θA= (1 + Amin)(1 − µl) 2 W (4.4)

A tradução do programa lógico P para a rede neural segue os passos seguintes: Para cada cláusula rl: L1, L2, . . . Lk→ Al, (k ≤ 0), realize:

a) A criação de neurônios da camada de entrada para cada Li e a dos neurônios de

saída rotulados como Al;

b) A criação do neurônio da camada oculta rotulado por Nl;

c) A conexão dos neurônios entre a camada de entrada e oculta através do peso W, se o literal Lj associado for não negado e −W caso seja negado. Realizar a mesma

operação entre a camada oculta e de saída;

d) Determinação do bias como descrito pelas Equações (4.3) e (4.4).

e) Definição a função de ativação da camada oculta e intermediária como sendo h(x) e da camada de entrada para g(x).

4.2

TEDA

Para um melhor entendimento relacionado a Tipicidade e Excentricidade, é impor- tante entender que esses conceitos são baseados na perspectiva espacial, mas especifica- mente na distância entre dois pontos de uma amostra. Esta distância pode ser Euclidiana, Mahalanobis, Cosseno, Manhattan e outros (KANGIN; ANGELOV; IGLESIAS, 2016; ANGELOV, 2014b; BEZERRA et al., 2016). Portanto, conhecendo-se as distâncias entre os pontos, é possível calcular a centralidade de um dado ponto, o que pode ser inter- pretado como quão próximo ou semelhante um dado é dos demais dados da amostra. Calculando a centralidade, é possível calcular a proximidade cumulativa, que é o inverso da centralidade ao quadrado, sendo representada por (4.5).

qN(xi) = N

i=1

d2(xi, xj), N > 1 (4.5)

sendo d(xi, xj) uma medida de distância entre os dados xi e xj que nesse trabalho foi

utilizado a euclidiana.

Excentricidade é a proximidade cumulativa normalizada. Então a excentricidade, ξN,

para um ponto dado xiem um conjunto de dados é calculado como 4.6:

ξN(xi) =

2qN(xi)

∑Nj=1qN(xj)

(4.6)

Substituindo 4.5 em 4.6, temos a equação da proximidade cumulativa:

ξN(xi) = 2

∑Nj=1d2(xi, xj)

∑Nj=1∑Nh=1d2(xj, xh)

(4.7)

O coeficiente 2 é adicionado na equação pois cada distância é contada duas vezes e mantém o valor da excentricidade xi entre 0 e 1. A tipicidade de um dado pode ser

calculada como um complemento da excentricidade. Portanto a tipicidade pode ser obtida pela expressão:

τN(xi) = 1 − ξN(xi), N > 2, i > 1 (4.8)

Ambos conceitos podem ser normalizados por:

ζN(xi) = ξN(xi) 2 (4.9) tN(xi) = τN(xi) N− 2 (4.10)

Como ξN(xi), pode estar entre 0 e 1, cada valor de ζN(xi) deve estar entre 0 e 0.5.

A normalização da tipicidade e excentricidade, assemelha-se à função de distribuição de probabilidade, já que a soma desses valores resultam em 1. Mas são diferentes, pois não requerem premissas que são obrigatórias na teoria da probabilidade e ambas represen- tam o padrão de distribuição espacial e a frequência de ocorrência dos dados amostrados. A figura 4.1 apresenta um exemplo, graficamente, do conceito de excentricidade para dados de duas dimensões, representando dois parâmetros. Neste exemplo, a amostra B é um dado típico, localizado próximo do outro dado e a amostra A pode ser considerada excêntrica porque está espacialmente mais distantes dos outros dados. Resumidamente, A pode ser considerado mais excêntrico que B e B é mais típico do que A (ANGELOV,

4.2. TEDA 45

2014a).

Figura 4.1: Exemplo de excentricidade e tipicidade de um dado.

Todos os conceitos apresentados são aplicados a fluxo de dados. Para a distância Eu- clidiana ao quadrado, a excentricidade pode ser calculada através da atualização da mé- dia, µ, e a variância, σ2(ANGELOV, 2014b). Então, depois de N amostras, temos (4.11) e (4.12): µN = N− 1 N µN−1+  1 N  xN, µ1= x1 (4.11) σ2N= (N − 1) N σ 2 N−1+ 1 N− 1||µN− xN|| 2, σ2 1= 0 (4.12)

Com a disposição dos valores acima, a excentricidade é atualizada usando (4.13).

ξN(xi) = 1 N+ (µN− xN) T N− xN)/Nσ 2 N (4.13)

Então a tipicidade é atualizada usando a equação 4.9.

4.2.1

TEDA-Cloud

TEDA-Cloud armazena a relevância de cada amostra nos seus núcleos. Neste método, a classificação online necessita que uma quantidade de informação esteja regularmente sendo adicionada à medida que novos dados são classificados. Portanto, reconhecer o funcionamento do TEDA-Cloud auxilia a compreender os problemas envolvidos em clas- sificar online baseado na Tipicidade e Excentricidade. O diagrama geral do algoritmo do TEDA-Cloud é apresentado na figura 4.2

Figura 4.2: Diagrama geral do método TEDA-Cloud.

Somente três características são usadas para a criação dos agrupamentos, que são: a quantidade de amostras pertencentes ao grupo i, a média e a variância. Estas caracte- rísticas estatísticas devem ser usadas para calcular a excentricidade para cada elemento. Pode ocorrer que amostras pertençam a mais de um núcleo simultaneamente. Quando verificado em cada dado, pode ocorrer que uma amostra pertença a mais de um conjunto. Desta forma, para determinar qual núcleo deve rotular cada dado é utilizada a inequação de Chebyshev. Quando novas amostras são apresentadas, é verificada qual a pertinência de cada um para os núcleos já definidos. Esta verificação é realizada através da inequação de Chebyshev apresentado a seguir (BEZERRA et al., 2016; SAW; YANG; MO, 1984):

P{|X − µ| > Nσ} < 1

N2 (4.14)

Ou uma inequação similar, de acordo com (4.15):

P{|X − µ| ≥ Nσ} ≤ 1

N2 (4.15)

Estas inequações dizem que a probabilidade das amostras se desviarem da média ser su- perior a N vezes o desvio padrão não será superior a 1/N2. Para analisar esta inequalidade na perspectiva do TEDA, em termos da excentricidade normalizada (4.16) é utilizada.

4.2. TEDA 47

ζN(xi) <

(m2+ 1)

2M (4.16)

Sendo que m representa o número de desvios da média escolhido para representar os dados, ζN(xi) e M são a excentricidade normalizada e a quantidade das respectivas

amostras do agrupamento.

Quando a amostra é classificada não pertencente a um grupo, o agrupamento não é al- terado. Se pertencer ao conjunto de dados, o agrupamento será atualizado iterativamente. Primeiro haverá uma atualização do número de dados.

SNi:= SNi+ 1 (4.17)

Onde SNi é o número de dados que o conjunto i representa. Então a média e variância

será atualizada por:

µiN :=S Ni− 1 SNi µ i N+ 1 SNixN (4.18) σ2Ni:= SNi− 1 SNi σ 2 Ni(xi) + 1 SNi− 1||xN− µ i N|| 2 (4.19)

Com XN sendo uma amostra capturada em tempo real. Depois dessa atualização, a

excentricidade deverá ser atualizada juntamente com a excentricidade normalizada.

ξN(xi) = 1 SNi + (µN− xN)T(µN− xN) ((SNi)(σ2 N)) (4.20)

Quando um novo dado não se encaixa em nenhum agrupamento, um novo conjunto é criado. Neste caso, o novo grupo deverá possuir os seguintes parâmetros SNi= 1, µi

N= xN

e σ2N

i= 0. Onde µ

i

N é o centro.

Como mencionado anteriormente, existem algumas situações onde os agrupamentos compartilham algum dado e a intersecção ocorre. Estas intersecções podem ocorrer entre dois ou mais conjuntos. Em algumas situações, nas quais os núcleos compartilham uma grande quantidade de dados, os agrupamentos devem ser unidos removendo as configu- rações anteriores e construindo um novo conjunto de sua união. As regras que definem a mesclagem dos conjuntos são apresentadas em (4.21) or (4.22).

SNi∩Nj > SNj−Ni (4.21)

onde SNi∩Nj é o número de pontos da intersecção dos núcleos N

ie Nj.

Isto significa que dois agrupamentos são unidos quando o número de amostras perten- cente aos dois são maiores que os pertencentes exclusivamente a um deles. As equações (4.23), (4.24) e (4.25) representam as propriedades que definem o conjunto união dos agrupamentos. SNl = SNi+ SNj− SNi∩Nj (4.23) µlN= (S Ni)(µi N) + (SNj)(µ j N) SNi+ SNj (4.24) σ2= (SNi)(σ2 Ni) + (S Nj)(σ2 Nj) SNi+ SNj (4.25)

4.2.2

TEDA-CLOUD Modificado

O novo método TEDA-Cloud Modificado propõe uma aceleração do processo de clus- terizaçãodo fluxo de dados. Isto é possível pois existe uma redução dos dados armaze- nados e também pelo fato de somente os agrupamentos que receberam dados serem os candidatos para uma nova fusão. Além disso, as inequações (4.21), (4.22), (4.23), (4.24) e (4.25) necessitam que sejam armazenados para cada agrupamento todos os pontos con- tidos.

Os valores utilizados de SNi, SNj e SNi∩Nj nas fórmulas somente são possíveis pois al-

gumas informações devem estar armazenadas em todos os agrupamentos. Isto prejudica o algoritmo em tempo computacional, pois, existe redundância de informações. No pior caso, pode ocorrer que os dados estejam simultaneamente na intersecção de todos os con- juntos, necessitando que todas as combinações das intersecções sejam informadas sobre a quantidade de dados classificados. Situações como essa podem exceder até mesmo a quantidade de amostras pretendidas para a classificação.

Há a necessidade de armazenar as amostras classificadas para cada grupo de dados, no entanto, ao fazer isso mais informação permanece guardada para ser processada.Por exemplo: Considere que em determinada etapa da clusterização existem n grupos, cada qual com Si= SiN de amostras classificadas sendo 1 < i < n. Assim, existem Si j = SNi∩Nj

armazenados para cada par de conjunto i e j com 1 ≤ i < j ≤ n. A equação (4.26) apre- senta a quantidade de dados necessários que sejam armazenados e para análise sob a necessidade ou não da fusão entre os agrupamentos.

4.2. TEDA 49 ST = n

i=1 Si+ n−1

i=1 n

j=i+1 Si j (4.26)

A tabela 4.1 apresenta o número de parâmetros requeridos para a classificação utili- zando o TEDA-Cloud. Apenas quando existir um único núcleo, Sinecessita ser salvo para este agrupamento. Existindo mais de um núcleo, é necessário considerar quantos pontos pertencem a cada par.

Outra possibilidade pode ser a identificação de cada amostra como membro, ou não, de cada grupo em relação a todos os núcleos, obrigando a realizar uma recontagem dos dados nas regiões de intersecções.

Tabela 4.1: Relação entre quantidade de núcleos e amostras armazenadas do TEDA- Cloud.

Número de núcleos Parâmetros requeridos

1 1 2 3 3 6 4 10 . . . . n n(n+1)2

Definimos então o armazenamento de todos os dados armazenados ST como função

da quantidade de núcleos por:

ST =n(n + 1)

2 (4.27)

O TEDA-Cloud padrão necessita que todos os dados sejam guardados, pois quando é solicitado saber quantos dados estão entre os conjuntos os dados armazenados para cada agrupamento deve ser re-contados. O TEDA-Cloud modificado proposto implica na redu- ção de informação de dados necessários a serem armazenamentos em cada agrupamento, pois somente suas respectivas médias e variâncias são guardadas. Estes valores são atu- alizados dinamicamente e preservam a rapidez de processamento. Agora, somente 3n informações são necessárias, pois para cada núcleo são armazenados média, variância e quantidade de pontos.

Os valores das intersecções dos conjuntos SiN∩ SNj não são conhecidos inicialmente. Estes valores são aproximados ou um critério baseado na média e variância deve ser defi- nido para prever os valores do número de pontos de cada par de núcleos.

quando os centros estiverem próximos o suficiente para serem considerados representando o mesmo padrão. Desta forma, a escolha da união dos núcleos é definida apenas pelas distâncias entre os centros.

Para determinar a união entre dois núcleos NA e NB, a distância entre centros é usada.

Considerando amostras bidimensionais como indicado na Fig. 4.3, as distâncias entre os centros podem ser caculadas pela norma Euclidiana:

dAB= q

(~µA−~µB)2 (4.28)

Figura 4.3: Condição de união dos núcleos

O limite do núcleo pode ser definido pelo raio que representa exatamente os desvio padrão calculado no processo de clusterização. Se o limite de um cluster NA ou NB, e

sobre seus respectivos dados excederem a distância dAB, os núcleos devem ser unidos. As

condições de união são:

dAB < µA+ mσA (4.29)

dAB < µB+ mσB (4.30)

4.2. TEDA 51

dos dados categorizados e σA e σB os desvios padrões das nuvens NA e NB, respectiva-

mente. Estas equações substituem as equações 4.21 e 4.22 para a implementação do TEDA-Cloud Modificado. Na prática, os núcleos serão unidos quando a abrangência de um agrupamento invade o centro de outro. Isto pode ser percebido na figura 4.3. Quando a área de abrangência de dois núcleos não possui intersecção, então no momento anali- sado os clusters são interpretados como sendo dois agrupamentos (Figura 4.3a). Em 4.3b, os agrupamentos possuem uma intersecção mas não suficiente para decidir que os dois representam o mesmo núcleo. As outras apresentam uma intersecção grande o suficiente para que um núcleo invada o centro do outro agrupamento. Sendo a primeira uma inter- secção parcial e na segunda uma intersecção completa. Nestas duas situações, os núcleos devem ser unidos.

O novo núcleo gerado deverá incorporar características estatísticas dos núcleos que fo- ram fundidos. Portanto, a utilização das atualizações pelas equações (4.23), (4.24) e (4.24) são necessárias para lidar com a quantidade de pontos SNj ∩ Si

N. Já que essa informação

não é mais mantida, esta expressão deverá ser aproximada em função da quantidade de pontos de cada núcleo, das variâncias e de suas médias.

O maior agrupamento, com maior variância, incorpora o menor e precisa descobrir quais são a quantidade de pontos associados ao núcleo unido. A quantidade a ser aproxi- mada é portanto:

Si j= Si+ Si− j (4.31)

Sendo Si− j a quantidade de pontos que pertence ao cluster fundido menor e não per- tence ao maior. Este valor é aproximado como sendo proporcional à diferença de alcance dos núcleos sobre os dados.

Si j = α(rA− rB) (4.32)

com A representando o cluster de maior variância e rA e rB seus alcances na mesma

direção de um vetor ~µAB. O valor de α é escolhido de tal forma que é zero quando o

núcleo A incorpora por completo o núcleo B e vale σA

2σB quando o cluster maior não

incluir por completo o menor. As Equações (4.31) e (4.32) permitem que seja realizada uma aproximação de quantos pontos devem ter os núcleos fundidos.

Os dados foram analisados em função do tempo de espera para ser calculado uma nova classificação. Quando os sensores disponibilizam os dados, é preferível que o pro- cedimento de clusterização realize a classificação em um tempo menor se comparado à taxa de amostragem do processo. Deste modo, o TEDA-Cloud Modificado representará

adequadamente os padrões existentes na planta. O fluxograma apresentado na figura 4.4 evidencia a existência de dois processos simultâneos: O processo 01 (P-01) é responsável pela captura dos dados da planta, enquanto o processo 02 (P-02) executa a clusterização. O P-02 possui a frequência dependente da taxa em que os dados são disponibilizados através de P-01.

Os dados que são apresentados entram numa pilha de dados, com isso, elementos do topo serão os primeiros a serem processados. Um bom processo de clusterização online é portanto aquele em que poucos dados fiquem à espera de um processamento. Sendo o P-02 encarregado pela retirada dos dados amostrados que estiverem presentes na pilha.

O P-02 é dependente do que ocorre na planta, a duração de seu funcionamento e a configuração dos padrões encontrados tem relação com a frequência que os dados são apresentados. Se houver uma parada antecipada devido a intertravamentos previstos, por exemplo, a clusterização é interrompida. Caso contrário, toda a execução da planta é monitorada à procura de seus padrões.

Uma nova amostra é sempre retirada da pilha de dados disponíveis da planta. Caso não se encaixe em um padrão - cluster - já descoberto antes, um novo agrupamento é criado. O critério para decidir se os dados estão dentro dos padrões já criados é definido pela Equação (4.16).

Se durante o P-02 não houver dados disponíveis na pilha, duas situações podem ter ocorrido. Ou a planta terminou sua operação e a clusterização foi finalizada ou então a classificação do último dado foi rápida o suficiente para esperar que novos dados preen- cham novamente a pilha. A situação em que o P-02 espera P-01 é a mais desejada já que a