Com os índices de correlação, pode-se verificar a atuação dos diferentes consumidores em conjunto e separadamente. De forma separada podem ser utilizadas nove diferentes classes de consumidores, mas, existe também a possibilidade de uni-las em grupos, respeitando as correlações, o que possibilita uma geração de cenários limitada para ser posteriormente simulados com o programa NEWAVE.
Para tanto, são utilizadas as técnicas de clusterização. Existem várias delas na literatura atual. Elas podem ser técnicas hierárquicas, o que permite classificar todo o universo analisado em um número crescente ou decrescente de clusters a partir de uma sequência de sucessivas fusões ou divisões, obtendo no final uma estrutura em árvore conhecida por dendograma. Outros são os métodos não-hierárquicos, que têm por objetivo particionar diretamente o conjunto de objetos em um número fixo de grupos, de maneira que a heterogeneidade interna seja minimizada, formando grupos coesos, havendo o isolamento desses grupos, e aumentando a separação entre eles (Dubes et al, 1975) (Guardia, 2007).
Existe uma série de procedimentos de agrupamento baseados em diferentes procedimentos lógicos: como redes neurais e lógicas Fuzzy. Aqui são utilizados um método hierárquico de Ward e um método não hierárquico k-médias para o agrupamento das séries de potência consumida.
A. Método Ward
O método de Ward ou “Mínima Variância” foi desenvolvido por H. Ward Jr em 1963 (Mingoti, 2005). A formação dos grupos é feita pela maximização da homogeneidade dentro dos grupos. A soma de quadrados dentro dos grupos é
Universidade Federal de Itajubá - UNIFEI 46 usada como medida de homogeneidade. Desse modo, o método de Ward procura minimizar a soma de quadrados dentro do grupo. Os grupos formados em cada passo são resultantes de um grupo solução com a menor soma de quadrados (Sharma, 1996) (Ward, 1963).
B. Método k-média
É um método de partição que fornece indicações mais precisas sobre o número de conglomerados a ser formado. O critério mais utilizado de homogeneidade dentro do grupo e heterogeneidade entre os grupos é o da soma dos quadrados residuais baseado na análise de variância. Assim, quanto menor for o valor da variância, mais homogêneos são os elementos dentro de cada grupo e melhor será a partição (Bussab et al, 1990).
No método k-media muitas formas de medição podem ser empregadas, a distância Euclidiana entre as séries é a mais utilizada, porém, para nosso estudo, também utilizamos a correlação, porque é interessante a possibilidade de correlação negativa entre os setores para particionar agrupamentos, levando em consideração o perfil de carga da atividade econômica.
O mercado livre nacional possui nove tipos principais de consumidores que atuam entre si de maneira teoricamente independente. É dito teoricamente, porque com a análise das correlações e simples compreensão de políticas econômicas as quais ditam diretrizes aos setores da economia, mostram que os setores possuem sim correlações muitas vezes significativas entre si.
Quando analisamos as correlações, vimos que o setor de Metalurgia, além de ser um grande consumidor, possui tendência de consumo um tanto invertida com os demais setores, resultando em uma correlação negativa. A questão agora é se os demais setores da economia possuem correlações positivas como o crescimento individual, ou em grupo, desses setores poderia afetar a possibilidade de liberação de lastro nos contratos de energia elétrica no Brasil. Vale lembrar que a energia elétrica é uma commodity especial que não possui possibilidade de grandes reservas após sua geração.
Universidade Federal de Itajubá - UNIFEI 47 que temos grupos coerentes de setores, pode-se verificar o possível montante de carga injetado no sistema. Utilizando o método hierárquico Ward pode-se criar um dendrograma que apresenta a divisão dos grupos de acordo com as grandezas de distancia entre as curvas. A Figura 6-3 presenta um dendrograma.
Figura 6-3 Dendrograma dos setores que compõe os consumidores do Mercado Livre de Energia Elétrica.
Através de simples observação do dendrograma pode-se visualizar a formação dos grupos. Por critérios de distancia teríamos, no mínimo, cinco diferentes curvas: (i) o setor 1 estaria só em uma curva; (ii) os setores 2 (Químicos), 5 (Celulose) e 4 (Veículos) estariam em uma curva; (iii) o setor 3 (Minérios) em outra; (iv) os setores 6 (Bebidas), 7 (Madeira) e 9 (Serviços) em outra curva, e; (v) o setor 8 (Têxteis) só em um última curva.
Aplica-se em seguida o método k-medias que diferentemente do método Ward, é um método não hierárquico e possibilita escolher o número de clusters que gostaríamos de ter. Como temos apenas nove grupos, foram testados os números de grupos manualmente.
O método k-medias utilizado juntamente com a distância Euclidiana como critério de proximidade, assim como no Ward, somente isolou o setor de Metalurgia a partir da formação de cinco ou mais grupos. Contudo, quando da utilização do método k-medias não mais com distancia Euclidiana e sim com o
Universidade Federal de Itajubá - UNIFEI 48 uso de correlações, todas as divisões isolaram o setor de Metalurgia em um único grupo, porque, como visto anteriormente, o setor de Metalurgia tem correlação negativa com todos os demais setores, o que gera uma distancia maior durante o cálculo.
Assim, unindo as soluções dos métodos baseados em distancia entre as curvas e as soluções dadas por meio de distancia entre valores de correlações, temos que o ideal é fazer previsões isoladas e com crescimento conjunto até cinco curvas. Formamos assim os grupos necessários para a simulação no programa NEWAVE, da maneira como apresentado na Tabela 6-1.
Tabela 6-1 Grupos para simulação.
Etapa 1 Todos os setores crescem de maneira independente 9 series
Etapa 2 Apenas os setores 2 e 5 são agrupados 8 séries
Etapa 3 Os setores 7 e 9 também passam a ser agrupados 7 séries
Etapa 4 O setor 6 se alinha ao grupo dos setores 7 e 9 6 séries
Universidade Federal de Itajubá - UNIFEI 49