Testes com IA em mercados de previsão mostram resultados decepcionantes
Plataformas como Kalshi e Polymarket ganharam destaque recentemente, atraindo investidores e até a atenção de reguladores. Nas redes sociais, não faltam relatos de usuários que afirmam ter enriquecido rapidamente ao usar modelos de IA para operar nesses mercados. No entanto, um estudo recente publicado na Cornell University archive arXiv coloca essas promessas em xeque.
Pesquisadores da Arcada Labs, por meio do Prediction Arena benchmark, testaram seis modelos avançados de IA, cada um com US$ 10 mil para operar em mercados de previsão ao longo de 57 dias. O objetivo era avaliar como esses sistemas lidavam com informações em tempo real e tomadas de decisão em plataformas como Kalshi.
Resultados revelam perdas significativas
Segundo Grace Li, cofundadora da Arcada Labs e coautora do estudo, o experimento buscava uma avaliação realista sobre a capacidade dos modelos de tomar decisões em tempo real e serem recompensados proporcionalmente à ousadia de suas escolhas.
Os resultados não foram animadores: todos os modelos perderam dinheiro, com prejuízos variando entre 16% e 30,8% no Kalshi. No Polymarket, as perdas foram menores, mas ainda significativas. Li atribui essa diferença ao grau de liberdade dado aos modelos: no Polymarket, eles podiam operar em qualquer mercado, enquanto no Kalshi tiveram acesso a apenas 26 mercados pré-selecionados.
«Não percebemos, a princípio, o quanto dar liberdade total aos modelos para escolher seus próprios mercados teria um impacto tão grande.»
O que os resultados realmente significam?
Li destaca que, no Polymarket, os modelos estão começando a cumprir parte da expectativa gerada. Em testes internos recentes, o Opus 4.6 realizou operações excepcionais. No entanto, ela ressalta que esses sucessos isolados não devem ser interpretados como esquemas de enriquecimento rápido.
«O que estamos vendo é um indício do que modelos cada vez mais autônomos poderão fazer no futuro», afirmou Li. «Imaginamos que eles melhorarão progressivamente, superando o desempenho humano, até que fundos de hedge baseados em IA se tornem comuns.»
O foco vai além do lucro
Para a pesquisadora, o aspecto mais relevante não é o ganho econômico imediato, mas o que essa nova unidade de inteligência representa para a humanidade. «Estamos mais interessados em entender o que essa capacidade adicional de inteligência significa para o futuro da sociedade», concluiu.