IA redefine limites em cibersegurança autônoma
Dois dos modelos de inteligência artificial mais avançados do mercado — Claude Mythos Preview, da Anthropic, e GPT-5.5, da OpenAI — superaram significativamente o ritmo de progresso já acelerado das IAs em tarefas autônomas de cibersegurança. As conclusões são de estudos recentes divulgados pelo AI Security Institute (AISI), do Reino Unido, e pela Palo Alto Networks.
Ritmo de evolução surpreende especialistas
O AISI, responsável por avaliar modelos de IA de fronteira em nome do governo britânico, revelou que ambos os modelos excederam as projeções de confiabilidade de 80% em tarefas cibernéticas autônomas. Até então, o instituto estimava que esse índice dobraria a cada cinco meses — um ritmo já considerado acelerado. Agora, a evolução parece ter entrado em uma nova fase.
"A capacidade autônoma de cibersegurança e desenvolvimento de software da IA de fronteira está avançando rapidamente: o tempo necessário para concluir tarefas cibernéticas autônomas dobrou em questão de meses, não anos."
Resultados inéditos em simulações de ataques
O AISI realizou testes em cyber ranges — ambientes controlados que simulam ataques multiestágios contra redes empresariais não protegidas. Os resultados foram surpreendentes:
- Claude Mythos Preview tornou-se o primeiro modelo a concluir dois cenários de teste:
- "The Last Ones" (ataque a uma rede corporativa de 32 etapas): sucesso em 6 de 10 tentativas;
- "Cooling Tower" (anteriormente insolúvel para qualquer IA): sucesso em 3 de 10 tentativas.
- GPT-5.5 também concluiu "The Last Ones" em 3 de 10 tentativas.
Palo Alto Networks confirma avanços
A empresa, parceira da Anthropic no Project Glasswing, testou o Claude Mythos e outros modelos, como o Claude Opus 4.7 e o GPT-5.5-Cyber, da OpenAI. Os resultados foram igualmente impressionantes:
- As IAs identificaram 26 CVEs (vulnerabilidades críticas) em mais de 130 produtos, um volume superior à média mensal de menos de cinco;
- Todas as vulnerabilidades críticas em produtos SaaS foram corrigidas, com patches disponíveis para sistemas operados por clientes.
Segundo a Palo Alto Networks, os novos modelos demonstram capacidade excepcional para encontrar e explorar vulnerabilidades em tempo quase real.
Limitações e incertezas
Apesar dos resultados promissores, o AISI ressalta que as conclusões são baseadas em um número limitado de modelos e que as tarefas mais complexas ainda carecem de dados comparativos humanos suficientes. No entanto, mesmo com a exclusão de um modelo da análise, a tendência de dobrar o desempenho a cada poucos meses se mantém, com variações de menos de um mês na estimativa.
Outro estudo, conduzido pela METR (organização sem fins lucrativos que avalia a velocidade da IA em tarefas de software), reforça a necessidade de monitoramento contínuo desse progresso acelerado.