Vulnerabilidade no plugin do Claude para Chrome permite sequestro de agentes de IA

segurança cibernética Anthropic agentes de IA Claude AI GitHub segurança de extensões Chrome vulnerabilidade em IA LayerX exploit de extensões Google Drive

Vulnerabilidade no plugin do Claude para Chrome expõe agentes de IA a ataques

A crescente adoção de agentes de IA por empresas e governos para acessar a internet e executar tarefas complexas tem revelado falhas críticas em modelos de linguagem. A mais recente descoberta, feita pela empresa de segurança LayerX, aponta uma vulnerabilidade no plugin do Chrome para o Claude, da Anthropic, que permite que qualquer extensão — inclusive aquelas sem permissões especiais — injete instruções ocultas e assuma o controle do agente de IA.

Segundo Aviad Gispan, pesquisador sênior da LayerX, a falha está em um comando no código da extensão que possibilita a comunicação com o modelo de linguagem (LLM) do Claude, mas não verifica quem está executando o script. "Como resultado, qualquer extensão pode invocar um content script (que não requer permissões especiais) e enviar comandos para a extensão do Claude", afirmou Gispan.

Impacto da vulnerabilidade

Em um prova de conceito, a LayerX demonstrou como a falha poderia ser explorada para:

Extrair arquivos de pastas do Google Drive e compartilhá-los com terceiros não autorizados;
Monitorar atividades recentes de e-mail e enviar mensagens em nome do usuário;
Roubar código-fonte privado de repositórios conectados ao GitHub.

Gispan também conseguiu executar prompts arbitrários, contornar os sistemas de segurança do Claude, ignorar confirmações do usuário e realizar ações entre sites em várias ferramentas do Google. "Essa vulnerabilidade quebra efetivamente a segurança das extensões do Chrome, criando um primitive de escalonamento de privilégios entre extensões — algo que o modelo de segurança do Chrome foi projetado para evitar", escreveu o pesquisador.

Manipulação da interface do usuário

O Claude depende de texto, semântica de interface e interpretação de capturas de tela para tomar decisões. Os pesquisadores exploraram essa característica para modificar a interface do usuário, removendo rótulos e indicadores de informações sensíveis, como senhas e feedback de compartilhamento. Em seguida, instruíram o Claude a compartilhar arquivos com um servidor externo, tornando a atividade maliciosa praticamente indetectável.

Além disso, o modelo pode ser programado para apagar evidências de suas ações, como e-mails enviados ou registros de atividade, dificultando a detecção por defesas cibernéticas.

Ax Sharma, chefe de Pesquisa da Manifold Security, classificou a vulnerabilidade como "uma demonstração clara de por que monitorar agentes de IA apenas no nível de prompts é insuficiente".
"O aspecto mais sofisticado desse ataque não é a injeção de comandos, mas a manipulação do ambiente percebido pelo agente, fazendo com que suas ações pareçam legítimas. Essa é a categoria de ameaça para a qual a indústria precisa desenvolver defesas."

Resposta da Anthropic e medidas de mitigação

A LayerX relatou a falha à Anthropic em 27 de abril, mas afirmou que a empresa implementou apenas uma solução parcial. Segundo a LayerX, a Anthropic respondeu no dia seguinte que o bug era um duplicado de outra vulnerabilidade já em correção em uma atualização futura.

A correção, lançada em 6 de maio, introduziu novos fluxos de aprovação para ações privilegiadas, dificultando a exploração da mesma falha. No entanto, Gispan afirmou que ainda conseguiu assumir o controle do agente do Claude em alguns cenários, como ao alternar para o modo privilegiado, mesmo sem permissões adicionais.

Fonte: CyberScoop

← Anterior

Câmeras Blackmagic: controle remoto via Apple Watch para criadores de...

Por que Gaza deve ser o centro de nossas reflexões e ações políticas

15:52 · 15 maio 2026

ArXiv proíbe autores por um ano após envio de trabalhos gerados por IA

ArXiv, the open-access repository of preprint academic research, will ban authors of papers for a year if they submit obviously AI-generated work. Lat...

15:19 · 15 maio 2026

Por trás da notícia: novas músicas, polêmicas e bastidores da semana

This is Behind the Blog, where we share our behind-the-scenes thoughts about how a few of our top stories of the week came together. This week, we dis...

14:11 · 15 maio 2026

Cisco corrige vulnerabilidade crítica explorada por grupo de ameaças persistente

Attackers returned once again to a common target with a massive user base by exploiting a max-severity zero-day vulnerability affecting Cisco Catalyst...

20:35 · 14 maio 2026

AI avançada é classificada como 'guerra revolucionária' pelo Pentágono

Advanced artificial intelligence models will “fundamentally change warfare as we know it,” a top cyber official at the Defense Department said Thursda...

20:15 · 14 maio 2026

Segurança de identidades se torna prioridade máxima com a IA, alerta autoridade da Casa Branca

As AI becomes more integrated into federal IT (and attacker toolsets) government agencies will need to focus their resources on regulating and monitor...

14:23 · 14 maio 2026

Foxconn sofre ataque cibernético e interrompe fábricas na América do Norte

Foxconn, one of the world’s largest manufacturers of electronics sold by major tech vendors, is recovering from a cyberattack that disrupted some of t...

13:30 · 14 maio 2026

App de IA que analisa fezes tenta vender banco de dados com 150 mil imagens de usuários

A few weeks ago, I came across a wild post on Reddit’s r/DHExchange, a subreddit for trading large datasets: “I hoarded a large database of something...

22:29 · 13 maio 2026

IA supera todas as expectativas em testes de cibersegurança autônoma, revelam pesquisadores

Two of the most advanced artificial intelligence models — Anthropic’s Claude Mythos Preview and OpenAI’s GPT-5.5 — have significantly surpassed the al...

Cibersegurança

Falha no plugin do Claude para Chrome permitia que extensões maliciosas sequestrassem agentes de IA

Vulnerabilidade no plugin do Claude para Chrome expõe agentes de IA a ataques

Impacto da vulnerabilidade

Manipulação da interface do usuário

Resposta da Anthropic e medidas de mitigação

Câmeras Blackmagic: controle remoto via Apple Watch para criadores de...

Por que Gaza deve ser o centro de nossas reflexões e ações políticas

Cibersegurança

Falha no plugin do Claude para Chrome permitia que extensões maliciosas sequestrassem agentes de IA

Vulnerabilidade no plugin do Claude para Chrome expõe agentes de IA a ataques

Impacto da vulnerabilidade

Manipulação da interface do usuário

Resposta da Anthropic e medidas de mitigação

Câmeras Blackmagic: controle remoto via Apple Watch para criadores de...

Por que Gaza deve ser o centro de nossas reflexões e ações políticas

Artigos relacionados

ArXiv proíbe autores por um ano após envio de trabalhos gerados por IA

Por trás da notícia: novas músicas, polêmicas e bastidores da semana

Cisco corrige vulnerabilidade crítica explorada por grupo de ameaças persistente

AI avançada é classificada como 'guerra revolucionária' pelo Pentágono

Segurança de identidades se torna prioridade máxima com a IA, alerta autoridade da Casa Branca

Foxconn sofre ataque cibernético e interrompe fábricas na América do Norte

App de IA que analisa fezes tenta vender banco de dados com 150 mil imagens de usuários

IA supera todas as expectativas em testes de cibersegurança autônoma, revelam pesquisadores