Contexto

      Na minha trajetória (Leonardo) como estudioso e pesquisador na área de economia, observei que existe um certo glamour entre o público médio em relação ao investimento (mercado financeiro) em ações em situações semelhantes a estas:

“Vou juntar dinheiro para investir em ações”,

ou

“Eu não tenho conhecimento para investir em ações”.

Os profissionais da área, como agentes de investimento e corretores, tentam demonstrar entendimento, e quiçá um certo controle sobre – como veremos a frente – o cavalo bravo que é o mercado de ações. Sua missão como especialista é aparentemente simples: indicar aos seus clientes a compra de ativos que vão subir, e recomendar a venda dos ativos que vão descer.

A frente faremos um breve tour pelos estudos teóricos que arguem sobre a possibilidade de prever o movimento do mercado financeiro, onde argumento que o retorno de ativos financeiros é aleatório e imprevisível através de análises tradicionais – até mesmo para os profissionais de investimento. E possíveis caminhos para o uso de Inteligência Artificial no mercado de capitais.

Um pouco de história

   Já no ano de 1900, com a tese de doutorado de Louis Bachelier, este sugeriu que o mercado financeiro parecia seguir um passeio aleatório, ou um “caminhar de bêbado”, onde estando o bêbado em uma posição qualquer, não se pode prever a direção do próximo passo. Tal constatação empírica foi explicada na década de 50 por Eugene Fama com a sua hipótese dos mercados eficientes. Tal hipótese sugere que os ativos financeiros são sempre “apostas justas”, ou seja: a expectativa de ganho ao se comprar um ativo financeiro é exatamente igual a expectativa de perda a qualquer momento. Tal ideia é justificada pelo princípio de arbitragem, onde os investidores – de conhecimento de toda a informação disponível, e inseridos em um mercado com muitos compradores e vendedores, reagem tão rapidamente a uma possibilidade de ganho ou perda, que fazem com que os preços se corrijam quase que instantaneamente para o novo preço justo, onde novamente, a chance de ganho e perda se equivalem.

A hipótese dos mercados eficientes

A hipótese dos mercados eficientes possui três versões: a fraca, a semiforte, e a forte.

  • Na versão fraca, os mercados já incorporam toda a informação pública disponível no passado, e logo, não é possível prever o mercado com base nas séries de dados passadas utilizando métodos estatísticos.
  • A versão semiforte adiciona a ideia de que qualquer nova informação pública é precificada instantaneamente, de modo que não se pode lucrar com ela. Por exemplo, se é lançada uma notícia pública de que a Rússia passará a importar minério de ferro exclusivamente do Brasil, no tempo necessário para a compra de ações de uma mineradora, os preços dessa já terão subido expressando a nova expectativa de rentabilidade da empresa, e a oportunidade de ganho não mais existe.
  • Na sua versão forte, considera que até mesmo a informação privilegiada já está incorporada nos preços. É importante mencionar que a hipótese dos mercados eficientes é amplamente aceita entre os acadêmicos de finanças.

Dentre outras teorias rivais na explicação da inexplicabilidade do comportamento de séries financeiras, destacamos a abordagem através da teoria do caos, que sugere que séries financeiras são imprevisíveis devido a apresentarem sensibilidade às condições iniciais.

Demonstração

      Vamos ilustrar os conceitos tratados através de alguns experimentos numéricos. Primeiro, vamos observar as cotações diárias de preços da Petrobrás (PETR4) entre 17/07/2018 e 26/10/2018.

cotações diárias de preços da Petrobrás (PETR4)

cotações diárias de preços da Petrobrás (PETR4)

Agora vamos simular o comportamento de um passeio aleatório utilizando planilhas, e faremos a comparação com a série original. Começamos inserindo um número inicial em uma célula, digamos, o preço inicial na nossa série da PETR4 (R$18,27). Agora definimos a próxima observação como sendo igual a R$18,27, adicionado de um choque aleatório contínuo de amplitude arbitrária. Vamos desta forma, calcular uma sequência de 90 números. Após algumas tentativas, chegamos na série simulada em laranja:

Real vs Simulada

Real vs Simulada

Podemos observar semelhanças qualitativas no comportamento do preço da ação real, e da nossa simulação do “caminhar do bêbado”. Argumento aqui que com o número suficiente de tentativas, podemos chegar em séries virtualmente idênticas à qualquer série financeira real, utilizando somente variações aleatórias. Veja outro exemplo abaixo:

Real vs Simulada 2

Real vs Simulada 2

É comum dentre investidores privados e profissionais, assim como nos canais jornalísticos, a racionalização a posteriori do comportamento de séries financeiras, e mesmo a observação de padrões geométricos: “A ação caiu por causa da alta do petróleo”, ou “O ativo caiu devido à instabilidade política”, ou ainda “a ação está na sua resistência de baixo, e por isso deve subir”, quando de fato, não existe evidência qualquer que sugira que tal comportamento teve qualquer determinante acessível à nossa razão, e nem de que terá o comportamento previsto pelo analista no futuro. Em outras palavras:

depois do fato é fácil buscar o motivo. O desafio em ciência de dados e o verdadeiro diferencial competitivo na área financeira é exatamente o oposto.

Outra forma de pensarmos sobre a hipótese da eficiência de mercado, é observando a influência da variação passada dos preços nos preços futuros. Vamos medir a correlação (ou como as variáveis cô-variam em média) dos retornos diários da PETR4 considerando doze defasagens: isso é, o quanto a variação de preço de hoje sofre influência do preço do dia anterior, de dois dias anteriores, de três, e assim sucessivamente. Por exemplo, o fato de uma ação ter subido no dia anterior sugere que ela tem uma maior ou menor chance de aumentar hoje? No correlograma linear abaixo, as relações são tão ínfimas que mal podem ser vistas no gráfico, de modo que podemos aceitar confortavelmente a hipótese de que os retornos da série em questão não está associados aos seus valores passados, e logo, não podem ser usados para prever os valores futuros.

correlograma linear

Correlograma linear

 

Essas são as razões que me fazem relutante quanto a alguns pontos que parecem fazer parte do senso comum referente aos “etéreos” investimentos em ações. Acredito que alguns dos maiores mitos são:

  1. que o desconhecimento sobre o investimento em ações é uma grande perda para a pessoa média;
  2. os especialistas fazem previsões consistentemente corretas sobre os preços futuros; e por último,
  3. que a estratégia de investimento especulativos de curto prazo sejam recomendáveis, consistentes ou seguras, especialmente para o cidadão médio que deseja “sofisticar” os seus investimentos..

A estruturação de projetos de data analytics, não apenas para o mercado de ações mas de modo geral, consome mais de 80% do tempo no levantamento das fontes, limpeza e integração e dicionarização dos dados de análise. Somente depois da conformação do modelo Dataset (O que é dataset de análise?).

O estado da arte em algoritmos de inteligência artificial aponta para sistemas capazes de fazer a descoberta de padrões não lineares. Mas por que a não linearidade dos modelos é tão importante? Em breve vamos escrever sobre as diferentes perspectivas das análises econométricas tradicionais vs análises com advanced analytics.

Estado da Arte

Existem muitas aplicações no mercado até onde se estendem nossas pesquisas, contudo, verifica-se que a grande maioria das soluções auxiliam os contornos do trabalho de ações, e não diretamente a predição de acontecimentos, por exemplo:

  • Automação do processo de decisão com apoio de máquina;
  • Sistemas de apoio à;
  • Prevenção a fraude;
  • Sistemas avançados de detecção de comportamentos outliers (O que são outliers?);
  • Sistema de prevenção a fraudes.

Hoje um dos trabalhos mais importantes das corretoras é fazer a associação do perfil dos investidores das carteiras com base em combinações complexas de investimentos. Este é um dos pontos mais viáveis da integração dos mecanismos de inteligência artificial com o mercado, e é uma das funcionalidades desenvolvidas pela aquarela na plataforma VORTX. Que traz um contraponto importante de negócio, por ser capaz de capturar situações de não linearidade, e de gerar recomendações extremamente personalizadas de investimento totalmente baseadas em dados, numa espécie de Netflix do setor financeiro.

Outra funcionalidade da plataforma VORTX, que está na vanguarda da aplicação de inteligência artificial no setor financeiro, é a incorporação de análise semântica nas análises. De maneira semelhante ao que ficou consagrado no google analytics, informações textuais podem ser computacionalmente analisadas e transformadas em informação potencialmente utilizável em predições. Um exemplo é o uso de palavras chave em buscadores como o google e meios de comunicação como jornais e blogs (mais sobre análise semântica e a web 3.0).

Conclusões

Mas o que podemos dizer em relação ao futuro das análises financeiras? Embora os métodos estatísticos tradicionais tenham se mostrado ineficazes na predição de séries financeiras, o desenvolvimento e redução do custo de aplicações de analytics, – e em especial de inteligência artificial – permitem um vislumbre do momento em que os algoritmos possam captar a sutileza e complexidade dos dados financeiros de forma suficientemente rápida, e com um retorno superior ao seu custo de implementação. Mercados completamente eficientes – assim como a impossibilidade cabal de previsão – podem ser idealizações teóricas, todavia uma breve análise dos dados nos permite ver a complexidade envolvida em apreender um potencial pequeno componente preditivo de séries altamente aleatórias.

A comunidade acadêmica se mostra otimista, sendo que apenas nos últimos 30 dias, no momento da redação desse texto, mais de 30 artigos associando machine learning à previsão de séries financeiras foram publicados em periódicos científicos internacionais. Se tais métodos irão conquistar, mesmo que em parte, o aparente caos dos mercados de ativos financeiros, é uma previsão que não me arrisco a fazer.

Diferente de espíritos brilhantes do passado, que como Aldous Huxley e Jules Verne, tentaram com sucesso imaginar o futuro, mantenho-me humilde em relação a violência do acaso, e termino com uma fala do Economista ganhador do Prêmio Nobel de ciências econômicas, Friedrich Hayek: “The curious task of economics is to demonstrate to men how little they really know about what they imagine they can design”.

Autores
Leonardo Favaretto
Cientista de dados na Aquarela. Bacharel em Economia, e Mestrando em Economia com dissertação em economia computacional. Entusiasta do conhecimento em geral, e amante das artes marciais.

Joni Hoppen
Fundador da Aquarela, professor e palestrante na área de Ciência de Dados, mestre em Sistemas de Informação, focado em processos de rápida prototipação de Big Data Analytics e cultura de dados.

Informações para referenciação: Gostou do material? Caso queira enriquecer sua pesquisa ou relatório (seja blog post ou artigo acadêmico), referencie nosso conteúdo como: Aquarela 2018 - Inteligência Artificial para negócios (www.aquare.la).