Agentes de IA gastam dinheiro e fazem 'compras estranhas' em experimento da Anthropic

A Anthropic, empresa de IA, realizou um teste inusitado para avaliar como modelos de linguagem negociam em um ambiente de mercado. No experimento, a IA Claude foi incumbida de gerenciar uma máquina de vendas nos escritórios do Wall Street Journal, com um saldo inicial de US$ 1 mil. Em pouco tempo, o sistema realizou compras questionáveis, como um PlayStation 5, garrafas de vinho e até um peixe betta vivo, levando-o à falência financeira.

Diante do resultado, a empresa decidiu ampliar o teste com o Project Deal, um mercado virtual estilo Craigslist onde agentes de IA, representando funcionários da Anthropic, negociam entre si. Cada participante recebeu US$ 100 e uma lista de itens para vender ou comprar, como pranchas de snowboard, teclados, bolas de pingue-pongue e luminárias.

Negociações bizarras e resultados surpreendentes

A IA entrevistou os participantes para entender suas preferências e, com base nesses dados, criou agentes autônomos para negociar. Os resultados foram, no mínimo, curiosos:

  • 186 negociações concluídas envolvendo mais de 500 itens, mas nenhuma foi considerada trivial ou de fácil conclusão.
  • Os participantes avaliaram a justiça das negociações com uma média de 4 em uma escala de 1 a 7, classificada pela Anthropic como "medíocre".
  • Um usuário terminou com a prancha de snowboard que já possuía, após a IA concluir a transação sem perceber a duplicidade.
  • Outro agente ofereceu exatamente 19 bolas de pingue-pongue, justificando: "Perfeitas para beer pong, projetos de arte ou bases para olhos googly". Um segundo agente aceitou a proposta, alegando que poderia comprar "coisas estranhas" com o orçamento de US$ 5.

Em comunicado, a Anthropic comemorou o sucesso do experimento, afirmando que "é possível para agentes de IA representarem humanos em um mercado". No entanto, os resultados também levantaram questões sobre a capacidade de negociação autônoma da IA, especialmente em transações complexas ou subjetivas.

O futuro dos mercados controlados por IA

O teste sugere um cenário onde negociações automatizadas poderiam substituir interações humanas em plataformas como o Facebook Marketplace. Em uma extrapolação, a IA poderia até mesmo realizar operações em bolsas de valores ou mercados de apostas em nosso nome. Por enquanto, porém, os resultados são mais uma demonstração de como a tecnologia ainda está longe de replicar a sutileza das negociações humanas.

"O primeiro ponto a destacar é que nosso experimento funcionou: agentes de IA podem representar humanos em um mercado. Mas as negociações não foram notáveis — em muitos casos, foram até mesmo desequilibradas."

— Trecho do relatório da Anthropic

Para a empresa, o teste é apenas o começo. "Estamos apenas arranhando a superfície do que é possível", declarou um porta-voz. Enquanto isso, os usuários seguem com dúvidas: será que confiaríamos em uma IA para fechar nossos negócios?

Fonte: Futurism