IA redefine limites em cibersegurança autônoma

Dois dos modelos de inteligência artificial mais avançados do mercado — Claude Mythos Preview, da Anthropic, e GPT-5.5, da OpenAI — superaram significativamente o ritmo de progresso já acelerado das IAs em tarefas autônomas de cibersegurança. As conclusões são de estudos recentes divulgados pelo AI Security Institute (AISI), do Reino Unido, e pela Palo Alto Networks.

Ritmo de evolução surpreende especialistas

O AISI, responsável por avaliar modelos de IA de fronteira em nome do governo britânico, revelou que ambos os modelos excederam as projeções de confiabilidade de 80% em tarefas cibernéticas autônomas. Até então, o instituto estimava que esse índice dobraria a cada cinco meses — um ritmo já considerado acelerado. Agora, a evolução parece ter entrado em uma nova fase.

"A capacidade autônoma de cibersegurança e desenvolvimento de software da IA de fronteira está avançando rapidamente: o tempo necessário para concluir tarefas cibernéticas autônomas dobrou em questão de meses, não anos."

AI Security Institute (AISI)

Resultados inéditos em simulações de ataques

O AISI realizou testes em cyber ranges — ambientes controlados que simulam ataques multiestágios contra redes empresariais não protegidas. Os resultados foram surpreendentes:

  • Claude Mythos Preview tornou-se o primeiro modelo a concluir dois cenários de teste:
    • "The Last Ones" (ataque a uma rede corporativa de 32 etapas): sucesso em 6 de 10 tentativas;
    • "Cooling Tower" (anteriormente insolúvel para qualquer IA): sucesso em 3 de 10 tentativas.
  • GPT-5.5 também concluiu "The Last Ones" em 3 de 10 tentativas.

Palo Alto Networks confirma avanços

A empresa, parceira da Anthropic no Project Glasswing, testou o Claude Mythos e outros modelos, como o Claude Opus 4.7 e o GPT-5.5-Cyber, da OpenAI. Os resultados foram igualmente impressionantes:

  • As IAs identificaram 26 CVEs (vulnerabilidades críticas) em mais de 130 produtos, um volume superior à média mensal de menos de cinco;
  • Todas as vulnerabilidades críticas em produtos SaaS foram corrigidas, com patches disponíveis para sistemas operados por clientes.

Segundo a Palo Alto Networks, os novos modelos demonstram capacidade excepcional para encontrar e explorar vulnerabilidades em tempo quase real.

Limitações e incertezas

Apesar dos resultados promissores, o AISI ressalta que as conclusões são baseadas em um número limitado de modelos e que as tarefas mais complexas ainda carecem de dados comparativos humanos suficientes. No entanto, mesmo com a exclusão de um modelo da análise, a tendência de dobrar o desempenho a cada poucos meses se mantém, com variações de menos de um mês na estimativa.

Outro estudo, conduzido pela METR (organização sem fins lucrativos que avalia a velocidade da IA em tarefas de software), reforça a necessidade de monitoramento contínuo desse progresso acelerado.