Para o método híbrido, foi adotada a metodologia cascata. Neste modelo, a demanda prevista pela rede anterior é adicionada junto com as variáveis na rede posterior, assim como representado pela Figura 4.3. Para a criação do comitê de máquinas por meio do método em série, foram utilizadas cinco máquinas individuais, MLP, SVM, ELM e RF.
Figura 4.3: Representação do método híbrido aplicado para o comitê de máquinas
Fonte: Arquivo pessoal.
O modelo de comitê em série possibilita que o resultado da rede anterior entre como uma variável na rede seguinte. Isso faz com que os resultados sejam processados melho- rando o desempenho da rede como um todo.
No caso do método utilizado, foram realizados a princípio 13 testes, diferenciando a ordem e a quantidade de redes em cada um. Estes testes iniciais foram realizados com objetivo de se obter um parâmetro para determinar a ordem final de cada máquina em cada comitê proposto. As Tabelas 4.3, 4.4 e 4.5 apresentam os testes realizados, divididos em três grupos.
Para compor os testes de 1 a 13, foram analisados previamente os resultados obtidos pelo comitê em paralelo. A partir desses resultados foi determinada a ordem de cada máquina no comitê em série. Os testes 1 a 4 foram criados com as quatro máquinas inicias, ordenados a partir dos resultados do comitê em paralelo, no qual os teste 1 e 2 as máquinas vão do menor para o maior resultado e nos testes 3 e 4 do maior para o menor
resultado obtido. A partir desses quatro testes iniciais, pode-se observar que o teste 3 obteve um melhor desempenho, com isso foi criado o teste 5, mas invertendo a última máquina. No teste 6 foi eliminada uma máquina. A ordem das máquinas esta apresentada na Tabela 4.3.
Tabela 4.3: Testes 1 ao 6 Testes Ordem das máquinas
1 ML,SVM,ELM,RF 2 ELM,SVM,MLP,RF 3 RF,MLP,SVM,ELM 4 RF,SVM,ELM,MLP 5 RF,ELM,MLP,SVM 6 RF,MLP,SVM
Fonte: Arquivo pessoal.
A Tabela 4.4 apresenta o grupo de testes que foram utilizada apenas duas máquinas em séria, que são os testes 7 a 9.
Tabela 4.4: Testes 7 a 9 Testes Ordem das máquinas
7 RF,SVM
8 RF,MLP
9 MLP,SVM
Fonte: Arquivo pessoal.
Na tabela 4.5 esta representado o último grupo de testes, os testes de 10 a 13, no qual foram testadas máquinas iguais em série.
Tabela 4.5: Testes 10 a 13 Testes Ordem das máquinas
10 MLP,MLP
11 SVM,SVM
12 RF,RF
13 ELM,ELM
Capítulo 5
Resultados e Discussões
Neste capítulo são apresentados o estudo de caso e os resultados obtidos com a me- todologia. O capítulo está divido em três seções principais, a primeira seção: "Estudo de Caso", que é dedicado a apresentação do local do estudo e quais variáveis serão utilizadas no estudo. A segunda: "Avaliação da Correlação entre as variáveis e a demanda de água", apresenta os resultados obtidos para a avaliação da correlação entre a demanda de água e as variáveis através do estudo dos mapas auto-organizáveis e o PCA, além da análise por meio de aprendizado de máquinas para avaliação dos resultados obtidos. A terceira seção: "Comitê de Máquinas", são apresentados os resultados obtidos pelos dois comitês criados para cada setor estudado.
5.1
Estudo de Caso
Para o presente trabalho foi estudado o município de Franca, que se localiza no interior do Estado de São Paulo. O município possui uma grande importância econômica para o Estado, tendo aproximadamente 318.640 habitantes (IBGE, 2017), distribuídos numa área de 3439 km2. O município localiza-se a uma distância de 400km da cidade
de São Paulo, capital do estado. A Figura 5.1, mostra a posição geográfica da cidade de Franca no Estado de São Paulo.
Figura 5.1: Localização da cidade de Franca dentro do estado de São Paulo (a) e sua área (b)
Fonte: Google, 2018.
Para o estudo de previsão de demanda de água apresentado nesse trabalho, construiu- se um banco de dados a partir de dados históricos de demanda de quatro setores distintos (Aeroporto ZA, Aeroporto 3, Azevedo e Leporace). Os dados usados são de um período de 3 anos consecutivos, anos de 2013, 2014 e 2015, sendo que os dados estão dispostos de hora em hora. Os dados de demanda foram considerados os dados de vazão de entrada de cada setor e foram disponibilizados pela Companhia de Saneamento Básico do Estado de São Paulo (SABESP), que administra o abastecimento de água na cidade. Dos quatro setores estudados, três são considerados setores residenciais e um setor especial com grande consumidor, sendo eles, respectivamente, setor Leporace com 2506 conexões, Aeroporto ZA com 2728 conexões e Aeroporto 3 com 2168 conexões e o setor Azevedo com 10439 conexões. Na Figura 5.2, apresenta-se o comportamento dos dados históricos de demanda de água dos quatro setores estudados durante todo o período disponível para estudo.
Figura 5.2: Variação da demanda dos setores estudados durante todo o período de coleta de dados.
Fonte: Arquivo pessoal.
Já na Figura 5.3, apresenta-se o comportamento dos dados no período de um mês aleatório. Neste caso pode-se constatar uma periodicidade no consumo de cada setor, observando que existem alguns valores extremos, devido as características únicas de cada setor. O setor Azevedo é um grande consumidor, já que é responsável por abastecer uma penitenciária que esta localizada na cidade.
Figura 5.3: Variação da demanda dos setores estudados durante todo um mês.
Fonte: Arquivo pessoal.
Tabela 5.1: Parâmetros estatísticos para as séries temporais
Leporace Aeroporto ZA Azevedo Aeroporto 3 Total de dados da série 18166 12576 18935 17689
Média (l/s) 18.18 15.83 78,21 10,68
Desvio Padrão (l/s) 6.48 6.71 35,35 5,65
Fonte: Arquivo pessoal.
Como variáveis relevantes na demanda de água, foram utilizados dados climáticos, temperatura (◦C), umidade relativa do ar (%), velocidade do vento (m/s), precipitação (mm), e variáveis sociais, dia do mês, mês do ano, ano, hora do dia, dia da semana, presença ou não de feriado e estação do ano. As variáveis climáticas foram coletadas do banco de dados do Instituto Nacional de Meteorologia (INMET) (INMET, s.d.). Para a construção do banco de dados, fez-se necessário adequar os dados de demanda e as variáveis climáticas, uma vez que os mesmos estavam dispostos de hora em hora e as variáveis climáticas estavam dispostas em três medições por dia (00h, 12h e 18h). Sendo assim, o banco de dados das variáveis climáticas foi preenchido com a repetição dos valores medidos. Optou-se por utilizar da repetição uma vez que outros métodos como a média poderiam acabar perdendo alguns valores ou não representando tão bem a série histórica. Para o estudo de caso, foram usados dados horários de abril de 2013 a dezembro de 2015. As vantagens de serem utilizadas tais variáveis climáticas têm sido discutidas na literatura, assim como realizado por Bakker et al. (2014) e Praskievicz e Chang (2009), no qual foram avaliadas a influência de variáveis sociais e climáticas na previsão de demanda de água. A Figura 5.4 apresenta a relação entre as variáveis climáticas estudadas com a hora do dia, durante o período de estudo.
Figura 5.4: Variação das variáveis climáticas durante um mês. Tempo (h) Tempo (h) Tempo (h) Tempo (h) Temperatura (°C) Velocidade do Vento (m/s) Umidade relativa do ar (%) Precipitação (mm)
Fonte: Arquivo pessoal.