2.5 Architecture & Haute disponibilité
2.5.2 MoveIt Central
3.4.1 AMOSTRAGENS ALEATÓRIAS OU MÉTODO DE MONTE CARLO
O método de Monte Carlo (MMC) está baseado na amostragem aleatória das incerte- zas. Após a identificação da função de densidade de probabilidade das variáveis aleatórias de entrada, muitas amostras aleatórias (cenários) independentes e com a mesma probabilidade de ocorrência são geradas pelo gerador de número aleatório. Esse processo é repetido várias ve- zes até que um número adequado de variáveis de saída seja produzido. Na sequência, esses valores de saída são calculados em um modelo determinístico (AKBARI; RAHIMIKIAN;
KAZEMI, 2011; AKBARI; RAHIMI-KIAN; TAVAKOLI BINA, 2012). A amostragem alea- tória permite gerar vários cenários para simular a possível realização de incertezas. Em (AKBARI; RAHIMIKIAN; KAZEMI, 2011) é apresentada uma metodologia bastante expres- siva da forma como o MMC é aplicado (Figura 12). Outros modelos podem ser consultados nas
referências (MOEINI-AGHTAIE; ABBASPOUR; FOTUHI-FIRUZABAD, 2012; ORFANOS; GEORGILAKIS; HATZIARGYRIOU, 2013; PARK; BALDICK; MORTON, 2015; MOHAMED ABD EL MOTALEB; KAZIM BEKDACHE; BARRIOS, 2016)
Figura 12 – Aplicação do método de Monte Carlo para resolver problemas envolvendo incertezas.
Fonte: Elaboração do autor baseada em (AKBARI; RAHIMIKIAN; KAZEMI, 2011)
3.4.2 TÉCNICA DE CURVAS DE DURAÇÃO
A técnica de curvas de duração (TCD) é implementada em (BARINGO; CONEJO, 2012, 2013; MONTOYA-BUENO; MUNOZ; CONTRERAS, 2015; UGRANLI; KARATEPE, 2016; ASENSIO et al., 2018). Nessas referências, dados históricos de demanda elétrica e produção de energia eólica/solar são usados para construir as curvas de duração, mantendo a correlação horária entre os dados. A curva de duração de demanda é discretizada por um conjunto de blocos de tempo como mostrado na Figura 13(a). Nessa discretização po- dem ser consideradas diferentes estações do ano, dias úteis ou não úteis, períodos noturnos ou diurnos, etc. A função de densidade de probabilidade acumulada de demanda em cada bloco é dividida em um número predefinido de segmentos, cada um com uma probabilidade associada (Figura 13(b)). Os valores médios em cada segmento fornecem os níveis de demanda elétrica.
Os fatores de capacidade de energia eólica/solar são selecionados usando o mesmo procedi- mento que para os níveis de demanda. A incerteza é representada por níveis de demanda e fatores de capacidade de geração com probabilidades definidas, que combinadas dentro de cada bloco de tempo definem a árvore de cenários. A cada cenário é atribuída uma probabili- dade igual à probabilidade do nível de demanda multiplicada pela probabilidade do fator de capacidade de energia renovável. O peso do cenário dentro da função objetivo é calculado como o número de horas do bloco de tempo correspondente multiplicado pela probabilidade desse cenário. Coleta de dados de entrada das incertezas Geração de cenários baseada no método de simulação MC Redução de cenários Construção da árvore de cenários reduzidos Resolução do modelo determinístico para a árvore de cenários gerados
Figura 13 – Curvas de duração. (a) Níveis de demanda e fatores de geração. (b) Função de distribuição de proba- bilidade acumulada para um bloco de tempo.
.(a) (b) Fonte (MONTOYA-BUENO; MUNOZ; CONTRERAS, 2015)
3.4.3 TÉCNICAS DE AGRUPAMENTO OU CLUSTERING
As técnicas de agrupamento (TA) ou clustering, são ferramentas usualmente usadas na PE de forma direta ou combinada com outras metodologias (e.g. MMC, estados do sistema, PR, etc.) para processar os dados incertos e construir os cenários mediante a discretização representativa. Um cluster é definido como um grupo de observações semelhantes entre si e diferentes das observações em outros clusters. A definição de semelhança varia entre os dife- rentes algoritmos de agrupamento e pode ser representada pela distância euclidiana, distância probabilística ou outra métrica (NAHMMACHER et al., 2016). O objetivo de um algoritmo genérico de agrupamento é organizar os dados de processos físicos (e.g., demanda, produção de energia eólica ou fotovoltaica, etc.) em grupos de acordo com as semelhanças (BARINGO; CONEJO, 2013). No final do processo, as observações são reduzidas a um conjunto pequeno e suficiente de clusters que representam uma condição operacional do sistema (cenário). O centroide é o valor médio de todas as observações alocadas no cluster e o número de observa- ções fornece o peso de cada cenário. Como exemplo, na Figura 14(a) é mostrado o agrupamen-
to de dados em dois clusters.
Diferentes TA têm sido implementadas para aplicações em SEPs. Essas técnicas po- dem ser classificadas em: i) técnicas de agrupamento partitivas como k-means (BARINGO; CONEJO, 2013; QIU et al., 2017; ZHANG; CONEJO, 2018), fuzzy c-means (UGRANLI; KARATEPE, 2016), k-medoids, density peaks (LI; WANG; DING, 2018), hybrid clustering
(PONCELET et al., 2017); e ii) técnicas de agrupamento hierárquicas como Ward’s hierar-
chical (WARD, 1963; NAHMMACHER et al., 2016), Nearest neighbor and farthest neigh-
bor, Average linkage, weighted average linkage, etc.
Figura 14 – (a) Agrupamento (clustering) de dados. (b) Árvore de cluster ou dendrograma.
.(a) (b) Fonte MATLAB
O algoritmo hierárquico de Ward que será usado neste trabalho, agrupa dados em vá- rias escalas, criando uma árvore de clusters ou dendrograma (Figura 14(b)). A árvore não é um
conjunto único de clusters, mas uma estrutura hierarquia multinível, onde os clusters em um nível são combinados para formar os clusters no próximo. O algoritmo de Ward começa com clusters com apenas um membro. Na sequência, clusters semelhantes são agrupados iterati- vamente, garantindo em cada passo o menor aumento na soma total de erros quadráticos entre as observações e os centroides. O número de clusters é reduzido a um a cada iteração, criando assim o dendrograma. Isso permite decidir o nível ou a escala do agrupamento mais apropria- do para cada aplicação (NAHMMACHER et al., 2016).
3.4.4 ESTADOS DO SISTEMA
Para lidar com as limitações da modelagem usando TCD, uma metodologia alternativa é proposta em (WOGRIN et al., 2014; TEJADA-ARANGO et al., 2018; TEJADA- ARANGO; WOGRIN; CENTENO, 2018). Nessa abordagem, as horas individuais das séries temporais são coletadas em blocos de grandezas relevantes (e.g., máxima demanda – mínima geração, mínima demanda – máxima geração), chamados de estados do sistema (ES). Como apresentado na Figura 15, cada estado individual é um vetor de k elementos e cada elemento
SEP inteiro durante um período (e.g., um mês, um ano), enquanto o número de transições entre eles é armazenado em uma matriz de transição. A matriz de transição é obtida percor- rendo a sequência cronológica horária e contando quantas vezes elas saltam de um estado para outro. Através dela é possível capturar alguma informação cronológica, inclusive relacionada à transição entre os dias. No entanto, informações intradiárias geralmente são imprecisas. Os ES são estabelecidos através de um processo de agrupamento (e.g., k-means), que atribui um peso ou duração a cada estado em função do número real de períodos representados por ele.
Figura 15 – Representação dos estados do sistema.
Fonte (WOGRIN et al., 2014)
3.4.5 PERÍODOS REPRESENTATIVOS OU DIAS REPRESENTATIVOS
Com o intuito de melhorar a precisão com que as variáveis aleatórias são modeladas, o conceito de PRs foi formulado em (NAHMMACHER et al., 2016; PONCELET et al., 2017; QIU et al., 2017). Os PRs podem ser enxergados como um conjunto de períodos característi- cos (e.g., dias, semanas) que são cuidadosamente selecionados a partir de uma grande coleta de dados históricos de demanda e geração, descritos por numerosas séries temporais (TEJADA-ARANGO; WOGRIN; CENTENO, 2018). Um PR representa os períodos seme- lhantes com ele mesmo, portanto, o comportamento do SEP pode ser modelado com um nú- mero reduzido de PRs e todas as decisões de operação e expansão serão tomadas com base neles (TEJADA-ARANGO et al., 2018).
Existem discrepâncias sobre o número de horas, dias e até semanas que devem ser consideradas para cada PR. Em (SISTERNES; WEBSTER, 2013) PRs de dias ou semanas são sugeridos, o que aumenta a quantidade de cronologia preservada, mas também aumenta o esforço computacional. Já em (NAHMMACHER et al., 2016; PONCELET et al., 2017; QIU et al., 2017) são propostos PRs de 24 horas que são considerados suficientes para lidar com os
ciclos de operação de SAEs em aplicações de curto e médio prazo (TEJADA-ARANGO et al., 2018). Em relação à forma de construir os PRs, várias abordagens já foram implementa- das: técnicas heurísticas e critérios definidos pelo usuário (índices de validade externa); sele- ção aleatória aplicando o MMC (SISTERNES; WEBSTER, 2013); técnicas de clustering (NAHMMACHER et al., 2016; QIU et al., 2017; ZHANG; CONEJO, 2018); modelos de PLIM; e abordagens híbridos (PONCELET et al., 2017). Na seção 0 será apresentada a meto- dologia proposta para construir os PRs neste trabalho.