IA supera benchmarks de cibersegurança autônoma: entenda o impacto dos novos modelos

tecnologia IA Automação segurança cibernética cibersegurança vulnerabilidades Claude Mythos GPT-5.5 AISI Palo Alto Networks

IA redefine limites em cibersegurança autônoma

Dois dos modelos de inteligência artificial mais avançados do mercado — Claude Mythos Preview, da Anthropic, e GPT-5.5, da OpenAI — superaram significativamente o ritmo de progresso já acelerado das IAs em tarefas autônomas de cibersegurança. As conclusões são de estudos recentes divulgados pelo AI Security Institute (AISI), do Reino Unido, e pela Palo Alto Networks.

Ritmo de evolução surpreende especialistas

O AISI, responsável por avaliar modelos de IA de fronteira em nome do governo britânico, revelou que ambos os modelos excederam as projeções de confiabilidade de 80% em tarefas cibernéticas autônomas. Até então, o instituto estimava que esse índice dobraria a cada cinco meses — um ritmo já considerado acelerado. Agora, a evolução parece ter entrado em uma nova fase.

"A capacidade autônoma de cibersegurança e desenvolvimento de software da IA de fronteira está avançando rapidamente: o tempo necessário para concluir tarefas cibernéticas autônomas dobrou em questão de meses, não anos."

AI Security Institute (AISI)

Resultados inéditos em simulações de ataques

O AISI realizou testes em cyber ranges — ambientes controlados que simulam ataques multiestágios contra redes empresariais não protegidas. Os resultados foram surpreendentes:

Claude Mythos Preview tornou-se o primeiro modelo a concluir dois cenários de teste:
- "The Last Ones" (ataque a uma rede corporativa de 32 etapas): sucesso em 6 de 10 tentativas;
- "Cooling Tower" (anteriormente insolúvel para qualquer IA): sucesso em 3 de 10 tentativas.
GPT-5.5 também concluiu "The Last Ones" em 3 de 10 tentativas.

Palo Alto Networks confirma avanços

A empresa, parceira da Anthropic no Project Glasswing, testou o Claude Mythos e outros modelos, como o Claude Opus 4.7 e o GPT-5.5-Cyber, da OpenAI. Os resultados foram igualmente impressionantes:

As IAs identificaram 26 CVEs (vulnerabilidades críticas) em mais de 130 produtos, um volume superior à média mensal de menos de cinco;
Todas as vulnerabilidades críticas em produtos SaaS foram corrigidas, com patches disponíveis para sistemas operados por clientes.

Segundo a Palo Alto Networks, os novos modelos demonstram capacidade excepcional para encontrar e explorar vulnerabilidades em tempo quase real.

Limitações e incertezas

Apesar dos resultados promissores, o AISI ressalta que as conclusões são baseadas em um número limitado de modelos e que as tarefas mais complexas ainda carecem de dados comparativos humanos suficientes. No entanto, mesmo com a exclusão de um modelo da análise, a tendência de dobrar o desempenho a cada poucos meses se mantém, com variações de menos de um mês na estimativa.

Outro estudo, conduzido pela METR (organização sem fins lucrativos que avalia a velocidade da IA em tarefas de software), reforça a necessidade de monitoramento contínuo desse progresso acelerado.

Fonte: CyberScoop

← Anterior

Jets contratam Tim Patrick para reforçar o ataque no ataque

Senador questiona diretor do FBI sobre consumo de álcool em audiência explosiva

15:52 · 15 maio 2026

ArXiv proíbe autores por um ano após envio de trabalhos gerados por IA

ArXiv, the open-access repository of preprint academic research, will ban authors of papers for a year if they submit obviously AI-generated work. Lat...

15:19 · 15 maio 2026

Por trás da notícia: novas músicas, polêmicas e bastidores da semana

This is Behind the Blog, where we share our behind-the-scenes thoughts about how a few of our top stories of the week came together. This week, we dis...

14:11 · 15 maio 2026

Cisco corrige vulnerabilidade crítica explorada por grupo de ameaças persistente

Attackers returned once again to a common target with a massive user base by exploiting a max-severity zero-day vulnerability affecting Cisco Catalyst...

13:00 · 15 maio 2026

Clínica Mayo adota IA para gravar interações em pronto-socorros sem consentimento explícito

Mayo Clinic, the massive U.S. hospital network, is using what it describes as “Ambient Listening” to record patient interactions with nurses, includin...

20:35 · 14 maio 2026

AI avançada é classificada como 'guerra revolucionária' pelo Pentágono

Advanced artificial intelligence models will “fundamentally change warfare as we know it,” a top cyber official at the Defense Department said Thursda...

20:15 · 14 maio 2026

Segurança de identidades se torna prioridade máxima com a IA, alerta autoridade da Casa Branca

As AI becomes more integrated into federal IT (and attacker toolsets) government agencies will need to focus their resources on regulating and monitor...

14:23 · 14 maio 2026

Foxconn sofre ataque cibernético e interrompe fábricas na América do Norte

Foxconn, one of the world’s largest manufacturers of electronics sold by major tech vendors, is recovering from a cyberattack that disrupted some of t...

13:30 · 14 maio 2026

App de IA que analisa fezes tenta vender banco de dados com 150 mil imagens de usuários

A few weeks ago, I came across a wild post on Reddit’s r/DHExchange, a subreddit for trading large datasets: “I hoarded a large database of something...

Cibersegurança

IA supera todas as expectativas em testes de cibersegurança autônoma, revelam pesquisadores

IA redefine limites em cibersegurança autônoma

Ritmo de evolução surpreende especialistas

Resultados inéditos em simulações de ataques

Palo Alto Networks confirma avanços

Limitações e incertezas

Jets contratam Tim Patrick para reforçar o ataque no ataque

Senador questiona diretor do FBI sobre consumo de álcool em audiência...

Cibersegurança

IA supera todas as expectativas em testes de cibersegurança autônoma, revelam pesquisadores

IA redefine limites em cibersegurança autônoma

Ritmo de evolução surpreende especialistas

Resultados inéditos em simulações de ataques

Palo Alto Networks confirma avanços

Limitações e incertezas

Jets contratam Tim Patrick para reforçar o ataque no ataque

Senador questiona diretor do FBI sobre consumo de álcool em audiência...

Artigos relacionados

ArXiv proíbe autores por um ano após envio de trabalhos gerados por IA

Por trás da notícia: novas músicas, polêmicas e bastidores da semana

Cisco corrige vulnerabilidade crítica explorada por grupo de ameaças persistente

Clínica Mayo adota IA para gravar interações em pronto-socorros sem consentimento explícito

AI avançada é classificada como 'guerra revolucionária' pelo Pentágono

Segurança de identidades se torna prioridade máxima com a IA, alerta autoridade da Casa Branca

Foxconn sofre ataque cibernético e interrompe fábricas na América do Norte

App de IA que analisa fezes tenta vender banco de dados com 150 mil imagens de usuários