Nova pesquisa do setor financeiro destaca os principais obstáculos à integração de dados alternativos, com 61% citando problemas de análise e 53% apontando desafios de sourcing

Saiba como o “aumento da cadeia de valor dos dados” está levando a um ROI mais alto usando coleta de dados precisa e estratégias de governança, resultando em resultados algorítmicos, insights e decisões de investimento de maior qualidade.
7 min de leitura
Transparency in alt-data

Nesta matéria, analisaremos:

Uma nova pesquisa do setor financeiro foi publicada recentemente. Cem profissionais de empréstimos, fundos de hedge, bancos e seguros, tanto nos Estados Unidos quanto no Reino Unido, participaram. O relatório destacou o fato de que a grande maioria das instituições financeiras entende que precisa contar com fontes de dados externas. No entanto, grande parte desse setor dinâmico não possui o conhecimento interno nem a expertise para analisar adequadamente os dados alternativos e realmente obter benefícios operacionais. Este artigo enfoca tanto os desafios quanto os mecanismos tecnológicos de enfrentamento atualmente utilizados pelos participantes do setor.

Infographic elaborating how much each industry relies on alt-data to function

Fonte da imagem: Bright Data

Quais são os principais obstáculos à integração de dados alternativos no contexto das grandes finanças?

“Os principais obstáculos à integração de dados alternativos no contexto das grandes finanças incluem questões no nível da análise, com 61% dos entrevistados* citando isso como seu desafio mais provável, enquanto 53% citaram a obtenção/aquisição de dados como seu principal desafio.”

Principais impedimentos à análise de dados alternativos no setor financeiro

Com base nos resultados da pesquisa:

“64% dos profissionais de serviços financeiros* usam dados alternativos como parte da formulação de suas estratégias de investimento contínuas.”

Mas as coisas começam a dar errado quando os gestores de portfólio começam a obter dados:

  • A partir de uma grande variedade de fontes
  • Em volumes extremamente altos

As equipes de analistas de dados também enfrentam desafios, particularmente problemas relacionados à qualidade e compatibilidade dos dados coletados para alimentar algoritmos de investimento. Isso é especialmente verdadeiro para dados semiestruturados/não estruturados, que são difíceis de integrar a modelos de negociação baseados em dados que possuem predefinições exclusivas. Esse é o cerne da questão para muitas instituições financeiras que não possuem a infraestrutura cibernética necessária para processar e cruzar conjuntos de dados alternativos de maneira eficaz.

Isso, aliado à falta real de mão de obra qualificada e treinada nas mais recentes técnicas de coleta e processamento de dados, está criando obstáculos para as empresas em todo o cenário financeiro.

Por fim, as organizações financeiras estão encontrando cada vez mais dificuldade em cumprir os padrões de agilidade de dados que estabeleceram para si mesmas. Elas coletam dados-alvo e os armazenam em reservatórios do tamanho do Lago Superior, mas ainda assim não conseguem descontextualizá-los para tirar conclusões mais amplas que possam levar a oportunidades de monetização mais significativas.

Principais desafios na obtenção de dados

As dificuldades na análise de dados estão interligadas e, em alguns aspectos, se sobrepõem aos obstáculos na obtenção de dados. Os maiores desafios na obtenção de dados incluem:

Identificação de dados — isso significa ser capaz de localizar e organizar categoricamente conjuntos de dados que mantiveram metadados, com base no caso de uso e na classe de ativos, o que pode ter implicações operacionais consideráveis.

Replicabilidade do processo – Muitas vezes, as equipes são capazes de obter conjuntos de dados únicos devido a um determinado cache de informações que fica online ou alguma outra singularidade. No entanto, as empresas precisam de um fluxo de dados confiável e consistente.

Qualidade da informação – A IA e o ML têm uma importante “fase de treinamento”. É nessa fase que eles precisam ser alimentados com dados limpos e rastreáveis para que sua produção seja de alta qualidade e precisa. Atrasos ou corrupção de arquivos geográficos, por exemplo, podem prejudicar gravemente as percepções algorítmicas, como quais posições de títulos fechar e em que ponto de saída.

Fontes díspares – Os dados não vêm todos do mesmo lugar ou no mesmo formato. Alguns dados podem vir de plataformas sociais, enquanto outros vêm de resultados de mecanismos de busca e/ou registros da Comissão de Valores Mobiliários (SEC). Os formatos podem variar de arquivos de vídeo e voz a texto e logs do sistema. Agregar e cruzar essas informações em um sistema unificado pode ser um desafio.

Como as instituições financeiras estão prosperando, apesar dos desafios

Cada vez mais instituições financeiras começaram a perceber os benefícios de terceirizar suas necessidades de coleta de dados. Isso é feito na forma de compra de conjuntos de dados prontos para uso ou conectando sistemas e equipes com ferramentas que fornecem um fluxo automatizado e ao vivo de dados.

Essa abordagem elimina a maioria dos desafios enfrentados na fase de análise, pois as redes de coleta de dados são capazes de:

  • Adaptar conjuntos de dados às necessidades específicas da sua empresa
  • Garantir que a entrada/saída esteja no formato de arquivo desejado, permitindo uma integração mais fácil de dados de fontes diferentes
  • Ajudar você a evitar investimentos em sistemas de dados caros e especialistas em coleta de dados
  • Dê ao seu fundo a agilidade para ativar e desativar operações de coleta de dados por projeto (comumente conhecido como “Dados sob demanda”)

Essa abordagem também pode ser uma escolha prudente para escritórios menores e especializados que desejam se concentrar em investimentos orientados por dados, sem que a coleta de dados ocupe a maior parte do seu tempo.

Os principais benefícios de tratar os dados como uma mercadoria no contexto dos serviços financeiros e dos investimentos incluem:

Obter um fluxo de dados em tempo real e com baixa latência para informar decisões operacionais imediatas e instantâneas (compra, venda, venda a descoberto, etc.)

Tornar o treinamento e a personalização de IA e ML muito mais acessíveis e fáceis, de modo que a criação e o teste de modelos de negociação rápidos se tornem algo natural para os membros da equipe

Dimensionar as operaçõespara cima ou para baixo de forma rápida e sem complicações

Eliminar a necessidade de comprar/desenvolver hardware, software e protocolos/APIs proprietários caros

Desbloquear conjuntos de dadosdifíceis de obter ou propositadamente indetectáveis, como foi o caso dos hospitais americanos que trabalharam para ocultar as taxas de procedimentos utilizando um trecho de código designado

Conclusão

A coleta e implementação de dados alternativos ainda está em “fase de adoção” no setor financeiro, o que significa que ainda há espaço para obter uma “vantagem informacional” significativa.

Apesar de a maioria das instituições saber que tem muito a ganhar com o aproveitamento de dados externos, muitas não têm a capacidade ou o conhecimento para analisá-los e aproveitá-los adequadamente.

Portanto, conclui-se que a “cadeia de valor dos dados” tem uma relação inversa com o volume, custo, qualidade e produção em comparação com a maioria das outras commodities informacionais. Por exemplo, coletar um volume menor de dados estruturados de alta qualidade, entregues automaticamente a modelos de investimento, algoritmos e analistas, terá um retorno sobre o investimento (ROI) muito maior do que dados não estruturados de alto volume, coletados de fontes e formatos díspares.

Consequentemente, as empresas financeiras e as fintechs precisam ter uma estratégia clara de coleta e governança de dados que incorpore a automação da obtenção de dados , permitindo uma melhor gestão de ativos e estruturação de portfólios.

* Esses dados são baseados nos respondentes cujas organizações utilizam dados alternativos entre os pesquisados.