Approvisionnement des grands clients industriels

Os algoritmos de clustering (JAIN; MURTY; FLYNN, 1999) foram desenvolvidos com o objetivo de indentificar grupos de componentes de uma mesma amostra que possuem caracter´ısticas similares. Assim, os algoritmos de clustering, ou os procedimentos adotados pelos algoritmos de clustering, podem ser aplicados na classifica¸cão dos quadros de imagem de uma seqüência de v´ıdeo.

Em analogia aos métodos vistos anteriormente e introduzindo o jargão de clustering temos que: classes são denominadas de clusters; as médias de cada cluster são denotadas como centróide e a classifica¸cão é efetuada avaliando a menor distância entre o componente em questão e cada centróide.

1. Escolha um n´umero k de clusters.

2. Escolha k pontos iniciais para serem utilizados como estimativas dos centr´oides.

3. Examine cada ponto da série e coloque-o no cluster cujo centróide que estiver mais próximo. A posi¸cão do centróide é recalculada cada vez que um novo ponto é adicionado ao cluster.

4. Repita o passo 3 até que não haja mudan¸ca no cluster ou um número máximo de passos seja executado.

Figura 4.4: Algoritmo k-Means.

De modo geral, os algoritmos de clustering podem ser enquadrados em duas cate- gorias: hierárquicas e não hierárquicas. Os algoritmos hierárquicos visam uma classifica¸cão que atenda às especifica¸cões prévias, com o menor número de clusters poss´ıvel. Por outro lado, os algoritmos não hierárquicos objetivam uma classifica¸cão que atenda às especifica¸cões pré-estabelecidas, com um número determinado de clusters.

A literatura apresenta uma variedade de algoritmos de clustering de propósitos gerais ou espec´ıficos. Dentre esses, destacamos o algoritmo não hierárquico k-Means (MENASCE; ALMEIDA; DOWDY, 1994; LINDE; BUZO; GRAY, 1980). A Figura 4.4 sumariza o procedimento adotado pelo algoritmo k-Means.

Em nosso trabalho, decidimos pelo uso de um algoritmo baseado no k-Means. In- troduzimos algumas altera¸cões no algoritmo adaptando-o aos nossos objetivos. Op- tamos por um procedimento que possibilita a busca pelo número mais adequado de clusters, partindo de um determinado número k. Assim, se k clusters não forem suficientes para obten¸cão de uma classifica¸cão na qual todos os cluster possuam um coeficiente de varia¸cão abaixo do limiar desejado, o algoritmo acrescentará mais um cluster, repetindo o processo até a satisfa¸cão da condi¸cão ou até um número máximo de vezes.

1. Escolha um n´umero k de clusters.

2. Ordene a seqüência e divida em k blocos. Calcule a mediana de cada bloco e utilize cada mediana como estimativa inicial do centróide de cada cluster. 3. Examine cada ponto da seqüência, inserindo-os ao cluster cujo centróide que estiver mais próximo. Estabele¸ca o novo centróide do cluster escolhido para atribui¸cão como a média calculada após cada atribui¸cão.

4. Calcule o coeficiente de varia¸cão de cada cluster e determine o coeficiente de varia¸cão máximo. Caso o coeficiente de varia¸cão máximo seja menor do que o limiar, ou caso o número máximo de passos seja executado, termine. Caso contrário, divida o cluster com o coeficiente de varia¸cão máximo em 2 clusters e recalcule o centróide de cada novo cluster.

5. Repita os passos 3 e 4 até satisfazer a condi¸cão de término.

Figura 4.5: Algoritmo k+Means.

de clusters que introduzimos é uma caracter´ıstica dos algoritmos hierárquicos. As- sim, após essas altera¸cões, renomeamos o algoritmo para k+_{Means, simbolizando a}

possibilidade de aumento no n´umero de clusters3_.

A Figura 4.5 exibe o algoritmo k+_{Means. Observe que utilizamos um procedi-}

mento similar ao do método das medianas para inicializa¸cão dos centróides.

Nas Figuras 4.6 e 4.7 apresentamos um exemplo num´erico simplificado para o uso do algoritmo k+_{Means. Para o exemplo, considere uma seq¨}_{uˆencia X , com os valores}

mostrados, como entrada do algoritmo. Assuma C como o conjunto de clusters, ck o

cluster k, M o conjunto de centróides e mkcomo o centróide k. Os valores numéricos

do exemplo podem ser conferidos passo a passo, de acordo com o algoritmo, conforme exibimos nas figuras.

O resultado do procedimento seguido no exemplo ilustrado nas Figuras 4.6 e 4.7 pode ser visualizado graficamente na Figura 4.8. No gr´afico `a esquerda, exibimos

3_{Ball e Hall, em (}

BALL; HALL, 1965) apud (JAIN; MURTY; FLYNN, 1999), propuseram o algoritmo

ISODATA que ´e uma varia¸c˜ao do k-Means, na qual os clusters podem ser unificados e particionados

na busca de uma classifica¸cão ótima. Portanto, o algoritmo k+_{Means pode ser visto também como}

Seja uma seq¨_{uˆencia X , com limiar l = 0, 2.}

X = {11; 5; 20; 23; 12; 4; 14; 16; 8; 15; 22; 6} = {x1; x2; x3; x4; x5; x6; x7; x8; x9; x10; x11; x12}

1. Escolha um número k = 3 de clusters. 2. Ordene a seqüência

= {x6; x2; x12; x9; x1; x5; x7; x10; x8; x3; x11; x4}

e divida X0 _{em k clusters.}

C = {c1, c2, c3}

= {(x6; x2; x12; x9); (x1; x5; x7; x10); (x8; x3; x11; x4)}

Calcule a mediana de cada cluster cke utilize a mediana mk, como estimativa

inicial do centr´oide de cada cluster. M = {x2+ x12 2 ; x5+ x7 2 ; x3+ x11 2 } = {5, 5; 13; 21}

3. Examine cada ponto da seqüência, inserindo-os ao cluster cujo centróide que estiver mais próximo. Estabele¸ca o novo centróide do cluster escolhido para atribui¸cão como a média calculada após cada atribui¸cão.

∀x0

i ∈ X0, ∃ ck tal que dk = minj{|x0i− mj|}

atualizando o valor de ck e mk

ck = ck∪ {x0i}

mk =

Σt:xt∈ck xt

kckk

Ap´os a inser¸c˜ao de cada x0

i o novo conjunto de clusters ´e o seguinte:

C0 = {(x6; x2; x12; x9); (x1; x5; x7; x10; x8); (x3; x11; x4)}

M0 = {5, 75; 13, 6; 21, 66}

4. Calcule o coeficiente de varia¸cão de cada cluster C.O.V. = {0, 29; 0, 15; 0, 07} e determine o coeficiente de varia¸cão máximo.

C.O.V.max = 0, 29

Caso o coeficiente de varia¸cão máximo seja menor ou igual ao limiar, ou caso o número máximo de passos seja executado, termine.

C.O.V.max > l

Caso contrário, divida o cluster com o coeficiente de varia¸cão máximo em 2 clusters e recalcule o centróide de cada novo cluster.

Um novo cluster deve ser inserido na posi¸c˜ao 1 e os centr´oides recalculados:

C00 = {(x6; x2); (x12; x9); (x1; x5; x7; x10; x8); (x3; x1; x4)}

M00 = {4, 5; 7; 13, 6; 21, 66}

5. Repita os passos 3 e 4 até satisfazer a condi¸cão de término. Repetindo os passos 3 e 4 mais uma vez temos:

C000 = {(x6; x2; x12); (x9); (x1; x5; x7; x10; x8); (x3; x1; x4)}

M000 = {5; 8; 13, 6; 21, 66} C.O.V.’ = {0, 2; 0; 0, 15; 0, 07} C.O.V.’max = 0, 2

Termina.

Figura 4.7: Exemplo Num´erico do Algoritmo k+_{Means. Parte II}

2 4 6 8 10 12 14 16 18 20 22 24 0 2 4 6 8 10 12 14

Tamanho dos quadros (bits)

Quadros 2 4 6 8 10 12 14 16 18 20 22 24 0 2 4 6 8 10 12 14

Tamanho dos quadros (bits)

Quadros

Cluster 1 Cluster 2 Cluster 3 Cluster 4

Tabela 4.4: Estat´ısticas das classes da seqüência dino obtidas pelo Método Baseado em Clustering para 8 clusters.

CLASSE M´EDIA COEFICIENTE DE VARIAC¸~AO 1 2.418 0,18 2 3.756 0,11 3 5.708 0,12 4 8.671 0,12 5 13.378 0,14 6 22.678 0,17 7 43.076 0,14 8 62.194 0,14

a disposi¸cão gráfica dos pontos da seq¨_{uência X e à direita mostramos as médias} representativas (centróides) de cada cluster obtidas após o fim do procedimento. Tabela 4.5: Estat´ısticas das classes da seqüência dino obtidas pelo Método Baseado em Clustering – Algoritmo k+_{Means para 7 clusters.}

CLASSE M´EDIA COEFICIENTE DE VARIAC¸~AO 1 2.700 0,19 2 4.326 0,12 3 6.875 0,14 4 10.904 0,15 5 19.177 0,18 6 37.158 0,17 7 59.546 0,15

Utilizando a seqüência dino como dado de entrada para a implementa¸cão do k+_{Means e definindo um coeficiente de varia¸cão de 0,2 como limiar, obtivemos os}

resultados expressos na Tabela 4.4. Podemos observar que todos os clusters aten- deram `a especifica¸c˜ao desejada.

Explorando a capacidade do algoritmo k+_{Means de obten¸c˜ao de um n´}_{umero ade-}

quado de clusters que atendem aos requisitos pré-determinados, obtivemos os resultados mostrados na Tabela 4.5. Apresentamos uma ilustra¸cão gráfica da classifica¸cão

0 20000 40000 60000 80000 100000 120000 0 5000 10000 15000 20000 25000 30000 35000 40000

Tamanho dos quadros (bits)

Quadros Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6 Cluster 7

Figura 4.9: Seq¨uˆencia dino com 7 classes definidas pelo algoritmo k+Means.

efetuada pelo algoritmo k+_{Means na Figura 4.9. Esses resultados demonstram a pos-}

sibilidade de classifica¸cão da seqüência dino em 7 clusters com coeficientes de varia¸cão menores que 0,2.

Dans le document Etude relative à la fourniture d’électricité des grands clients industriels en Belgique en 2015 | CREG : Commission de Régulation de l'Électricité et du Gaz (Page 27-30)