SMSA

Programa de Projetos Pessoais (3P) – PET-MA

Descrição

Membros: Pedro Miola da Silva
Data de Início: 17/04/2020

Em tempos de crise, muito se ouve falar sobre grandes oscilações do mercado de ações. Enquanto alguns perdem muito dinheiro, outros, por estarem mais conscientes dos possíveis cenários futuros, conseguem minimizar suas perdas. Entretanto, é um grande desafio ter uma previsão do mercado, visto que ele é influenciado por muitas variáveis. Uma delas é o sentimento do acionista, isto é, se ele se sente mais ou menos confiante.

Felizmente, esse sentimento pode ser interpretado por uma subárea de inteligência artificial chamada Processamento de Linguagem Natural, ou seja, fazer um computador interpretar linguagem de seres humanos. Então, podemos aplicar uma Análise de Sentimento para descobrirmos a positividade ou negatividade das pessoas em relação as ações e com isso prever altas e baixas no mercado de ações.

Objetivos

O objetivo do projeto é analisar um conjunto de dados que avaliará o sentimento das pessoas em relação ao mercado de ações e, através de algoritmos de inteligência artificial, buscar previsões de movimentos futuros baseando-se em resultados passados.

Resultados

Projeto em andamento, acompanhe o progresso abaixo.

Andamento do Projeto

Progresso

15%

17/04/20

Atualmente o membro encontra-se na fase de estudos do projeto.

06/05/2020

O projeto foi planejado e sua primeira parte consiste na obtenção dos dados. Para isso, ele foi dividido em algumas etapas: conexão com a 'API', filtragem, limpeza e classificação dos dados.

20/05/2020

A conexão com a API e a primeira filtragem já foram feitas e agora o programa realiza o stream de tweets baseados em um filtro de palavras escolhido. O próximo passo é realizar a limpeza dos dados obtidos. Isso envolve a seleção das informações relevantes, eliminação de determinados caracteres dos textos e padronização do restante.

02/06/2020

A limpeza dos dados foi finalizada. É interessante ressaltar que depois que o software estiver pronto, conforme o resultado da análise, a limpeza poderá ser modificada para obtermos melhores resultados. Os próximos passos são aplicar etiquetas nos tweets, ou seja, separar os tweets por empresa ou ação a que se referem.

16/16/2020

A classificação foi finalizada e agora o programa identifica a qual empresa as informações se referem. Agora a segunda da parte do projeto começará a ser planejada.

30/06/2020

Após um estudo preliminar para o planejamento, o membro optou por utilizar Redes Neurais para realizar a análise.
Alguns modelos mais simples consideram apenas as palavras sem ordem e se baseiam em um dicionário existente para classificá-las. Ou seja, a nota de sentimento para cada frase será a média dos sentimentos de cada palavra, os quais já devem estar tabelados em algum dicionário pré existente. A utilização desse modelo foi desconsiderada por dois fatores principais: primeiramente ele pode ser facilmente enganado, uma vez que não considera a ordem e a combinação de palavras; o segundo fator é que a linguagem utilizada nas redes sociais é de difícil comparação com dicionários pré existentes, pois utiliza muitas abreviações, expressões, figuras de linguagem.
Com isso, foi decidido utilizar Deep Learning através das Redes Neurais, tendo em vista que não é necessário uma biblioteca de comparação e o modelo leva em consideração a ordem e combinação de palavras.