Indicateurs - Mise en œuvre d une activité de veille

Podemos afirmar que o objetivo geral deste trabalho foi atingido, sendo desenvolvido com sucesso um modelo preditivo, capaz de relacionar dados históricos de valores de ações de empresas multinacionais a notícias a elas relacionadas, publicadas em portais de notícias online.

O pré processamento de notícias para treinamento do modelo analisador de sentimentos utilizou diversas técnicas e diferentes algoritmos. Contudo, os resultados não demonstraram grandes diferenças em acurácia e se mantiveram sempre abaixo de 60%, o que é considerável um nível baixo de performance pelos autores deste trabalho. Uma hipótese levantada como motivo da baixa acurácia é o número de notícias disponíveis, de forma que o modelo não possui exemplos suficientes para ajustar seus pesos e performar com eficiência. Além disso, fica a possibilidade de se considerar os títulos das notícias juntamente ao conteúdo das mesmas.

O modelo final prevê flutuações de preços com elevada acurácia; entretanto, tornamos a mencionar aqui o módulo de análise de sentimentos. Embora funcional, não obteve os resultados de acurácia desejados. Isto nos faz questionar a relevância dos sentimentos como entrada do modelo preditivo, visto que até mesmo testes que não incluíram sentimentos como atributos trouxeram resultados muito semelhantes aos testes de cenário contrário.

Não obstante, foram realizados testes manuais em um período específico com o intuito de validar, em menor escala, o funcionamento do algoritmo como um todo. Os testes manuais tiveram como objetivo principal mostrar a existência de alguma correlação entre os valores das ações das empresas e as notícias relacionadas a estas que são lançadas pela mídia durante um dia.

Uma vez que os testes realizados alcançaram resultados muito semelhantes aos que seriam calculados por uma pessoa, acredita-se que o algoritmo conseguiu de alguma forma executar o que foi proposto, correlacionar notícias de portais online com a tendência do valor de fechamento das ações de uma empresa.

Apesar de rudimentares, os testes se mostraram bem sucedidos em alguns aspectos importantes. Foram validados o funcionamento do analisador de sentimentos, para as notícias do teste. Utilizando os resultados de predição de sentimentos de forma individual o algoritmo criado apresenta algumas falhas, mas utilizando o contexto deste trabalho (a média de sentimentos de notícias de um dia) o resultado foi satisfatório e totalmente dentro do esperado. Da mesma forma o preditor de valores, utilizando como base de comparação as tendências calculadas manualmente pelos autores deste trabalho, o preditor errou a tendência de 1 dos 6 dias de testes.

Quanto aos objetivos específicos desta pesquisa, afirmamos que o objetivo 1, relativo à pesquisa teórica sobre o estado da arte em extração e transformação de dados, foi realizada e diferentes técnicas até mesmo foram utilizadas. O mesmo pode ser dito sobre o objetivo 2, conforme conhecimentos adquiridos a partir dos os trabalhos relacionados destacados na seção 3.

Os objetivos de número 3 e 4 também foram concluídos, inclusive ambos se mesclando com o objetivo de número 1, visto que diferentes técnicas de pré processamento de dados e variados algoritmos foram aplicados no processamento de linguagem natural.

Estando objetivo específico de número 5 fortemente atrelado ao objetivo geral desta obra, que foi atingido, afirmamos que ambos foram concluídos com sucesso. O modelo preditivo demonstrou elevada acurácia para os casos de teste a que foi submetido.

Os objetivo 6 e 7 que tinham como objetivo colocar o modelo preditivo a prova, utilizando notícias fora do conjunto de dados utilizado no treinamento do mesmo. Não foi possível fazer os testes de comparação do modelo com notícias em tempo real, como era a intenção ao início do trabalho, mas foi possível criar um protótipo de modelo preditivo capaz de associar notícias com a flutuação do valor de fechamento de ação de uma empresa. Ambos os objetivos foram alcançados com certo sucesso, como descrito na seção 5.4.

Foram feitas comparações com modelos preditivos aplicados pelos trabalhos correlatos a esta pesquisa, mais especificamente nas seções 5.1.3 e 5.2.1. Sendo assim, foi atingido também o objetivo de número 8.

A partir desta pesquisa, percebemos que é pode ser beneficial uma análise mais aprofundada nos resultados dos testes, explorando matrizes de confusão e possíveis hipóteses que delas possam surgir. Para o classificador de ações em geral, também fica a proposta de utilizar diferentes parâmetros para a predição de ações, que possam ser obtidas através de diferentes fontes, além de diferentes configurações para determinar se um dia da bolsa é classificado como positivo, neutro ou negativo. É possível inclusive se utilizar métricas geradas a partir dos dados originais, como médias móveis, por exemplo.

Utilizar um maior conjunto de testes também pode se mostrar benéfico para a acurácia geral dos modelos. Isto pode ser obtido com a captura de notícias por um tempo maior que o realizado nesta pesquisa, ou, até mesmo, utilizando dados oriundos de terceiros. Desta forma se amplia não somente o número de notícias com as quais parametrizar o analisador de sentimentos, mas também o número de dias de mercado considerados pelo analisador de sentimentos, visto que ele é treinado com base somente em dias para os quais há notícias no conjunto.

A criação de uma interface para o usuário, talvez criando uma API com modelo de arquitetura REST, parametrizável, possa facilitar os testes e validações do modelo. O formato atual do preditor, apesar de funcional, ainda é bastante rudimentar no que diz respeito a interação de algum usuário não habituado com o padrão de funcionamento do modelo. Esta falta de uma interface simples dificulta bastante a realização dos testes e validações do mesmo, sendo no momento necessária a alteração direta no código fonte para testar qualquer modificação

Outro fator interessante é de verificar o impacto das notícias sobre a liquidez das ações, não somente o preço, visto que é possível que haja grande volume de transações, mesmo sem alterar o preço. Também acreditamos que é importante fazer com que seja possível configurar o uso da aplicação para diferentes empresas a partir de uma configuração, sem que haja mudanças manuais no código.

Referências

ASSAF NETO, Alexandre. Finanças corporativas e valor. 3° ed. São Paulo: Atlas, 2001.

LUGER, George F.. Inteligência Artificial. 6. ed. São Paulo: Pearson Education, 2013. 632 p.

PAGOLU, Venkata Sasank et al. Sentiment analysis of Twitter data for predicting stock market movements. 2016 International Conference On Signal Processing, Communication, Power And Embedded System (scopes), [s.l.], v. 0, n. 0, p.1345-1350, out. 2016. IEEE. http://dx.doi.org/10.1109/scopes.2016.7955659.

LUSTOSA, Volney Gadelha. O Estado da Arte em Inteligência Artificial. Colabor@: Revista Digital da CVA, Brasília, v. 2, n. 8, p.1-11, set. 2004. Semestral. Disponível em: <http://pead.ucpel.tche.br/revistas/index.php/colabora/article/viewFile/60/53>. Acesso em: 25 maio 2018.

CHOWDHURY, Gobinda G.. Natural language processing. Annual Review Of Information Science And Technology, [s.l.], v. 37, n. 1, p.51-89, 31 jan. 2005. Wiley. http://dx.doi.org/10.1002/aris.1440370103.

FAMA, Eugene F.. Efficient Capital Markets: II. The Journal Of Finance, [s.l.], v. 46, n. 5, p.1575-1617, dez. 1991. JSTOR. http://dx.doi.org/10.2307/2328565.

ANTUNES, M. A.; PROCIANOY, J. L. Os efeitos das decisões de investimentos das empresas sobre os preços de suas ações no mercado de capitais. Revista de Administração, v. 38, n. 1, p. 5-14, 2003.

SILVA, César Augusto Tibúrcio; PEREIRA, Vinícius Alves dos Santos. FATOS RELEVANTES E SUA INFLUÊNCIA NO PREÇO DAS AÇÕE S NO BRASIL. In: CONGRESSO USP DE INICIAÇÃO CIENTÍFICA EM CONTABILIDADE, 5., 2008, São Paulo. Anais... . São Paulo: Fea, 2008. p. 1 - 15. Disponível em: <http://www.congressousp.fipecafi.org/anais/artigos82008/575.pdf>. Acesso em: 26 maio 2018.

ALVARES, Reinaldo V. Investigação do Processo de Stemming na Língua Portuguesa. Niterói, São Paulo. 2005.

TRIM, Craig. The Art of Tokenization. 2013. Disponível em:

<https://www.ibm.com/developerworks/community/blogs/nlp/entry/tokenization>. Acesso em 10 de outubro de 2018.

FINLAY, Steven. Predictive analytics, data mining, and big data: myths, misconceptions and methods. New York: Palgrave Macmillan, c2014. xii, 248 p. ISBN 9781137379276.

MAYER-SCHÖNBERGER, Viktor; CUKIER, Kenneth. Big data: a revolution that will transform how we live, work, and think. Boston: Houghton Mifflin Company, c2013. 252 p. ISBN 9780544227750.

WU, Xindong; ZHU, Xingquan; WU, Gong-qing. Data mining with big data. Ieee

Transactions On Knowledge And Data Engineering, [s.l.], v. 26, n. 1, p.97-107, jan.

2014.

Institute

of

Electrical

and

Electronics

Engineers

(IEEE).

http://dx.doi.org/10.1109/tkde.2013.109.

Disponível

em:

<https://ieeexplore.ieee.org/document/6547630>. Acesso em: 23 nov. 2018.

ARUMUGAM, Paliah et al. Financial Stock Market Forecast using Data Mining

Techniques. International Multiconference Of Engineers And Computer Scientists,

Hong Kong, v. 1, n. 1, p.1-6, 17 mar. 2010. Anual. Disponível em:

<https://www.researchgate.net/publication/44260645_Financial_Stock_Market_For

ecast_using_Data_Mining_Techniques>. Acesso em: 23 nov. 2018.

CHEN, Ming-syan; HAN, Jiawei; YU, P.s.. Data mining: an overview from a database

Dans le document Mise en œuvre d une activité de veille (Page 85-104)