Vazamento do Claude Mythos da Anthropic expõe falhas em segurança de IA

Vazamento do Claude Mythos da Anthropic levanta dúvidas sobre segurança da IA

A Anthropic, empresa especializada em inteligência artificial, enfrenta um vazamento de dados em seu modelo Claude Mythos, que foi projetado para ser tão avançado em cibersegurança que, segundo a própria empresa, seria perigoso demais para uso público.

De acordo com informações da Bloomberg, um grupo não autorizado de usuários obteve acesso ao sistema desde o dia em que a Anthropic anunciou planos de oferecer o Mythos a um seleto grupo de empresas para testes. A empresa confirmou estar investigando o incidente.

Impacto na reputação da Anthropic

O vazamento representa um revés significativo para a Anthropic, que construiu sua imagem com base em segurança e responsabilidade no desenvolvimento de IA. A empresa tem sido referência em práticas rigorosas de segurança, mas o incidente expõe uma contradição em suas afirmações.

O Mythos foi revelado publicamente por meio de um vazamento anterior, antes mesmo de sua apresentação oficial. Agora, com o acesso não autorizado confirmado, a empresa enfrenta críticas sobre sua capacidade de proteger sistemas considerados críticos.

Reações e próximos passos

A Anthropic ainda não divulgou detalhes sobre a extensão do vazamento ou possíveis danos causados. A empresa afirmou que está investigando o incidente e que tomará as medidas necessárias para evitar novos problemas.

"A segurança é nossa prioridade máxima. Estamos analisando o ocorrido para garantir que nossos sistemas permaneçam protegidos."

— Declaração oficial da Anthropic

O caso levanta questões sobre a confiabilidade dos modelos de IA avançados e a capacidade das empresas de proteger tecnologias consideradas sensíveis.

Contexto do Claude Mythos

O Claude Mythos é um modelo de IA desenvolvido pela Anthropic, projetado para ser excepcionalmente competente em cibersegurança. Sua capacidade de identificar e neutralizar ameaças cibernéticas foi considerada tão poderosa que a empresa argumentou que seu uso público poderia representar riscos significativos.

Apesar disso, o vazamento demonstra que, mesmo em ambientes controlados, sistemas de IA avançados podem ser comprometidos.

Fonte: The Verge

← Anterior

Paolo Zampolli: O homem no centro dos maiores escândalos de Trump

Spirit Airlines pode desaparecer: crise financeira leva pedido de socorro ao governo dos EUA

22:25 · 15 maio 2026

YouTube amplia ferramenta de detecção de deepfakes para todos os usuários adultos

YouTube is expanding its AI likeness detection program to all users over the age of 18 - meaning just about anyone can have the platform hunt for pote...

21:51 · 15 maio 2026

Justiça dos EUA adia acordo bilionário da Anthropic por suspeitas de irregularidades

After several authors and class members raised objections to Anthropic's $1.5 billion settlement over its widespread book piracy to train AI, a federa...

20:38 · 15 maio 2026

ArXiv proíbe pesquisadores que publicarem artigos com conteúdo gerado por IA sem revisão

ArXiv, a popular platform for preprint academic research, is taking a new step to attempt to reduce the volume of papers that include AI slop. If a pa...

18:25 · 15 maio 2026

Servidor de pré-prints arXiv proíbe submissões com 'alucinações' geradas por IA

AI-generated slop has shown up everywhere, including in the peer-reviewed literature. Fake citations, unedited prompt responses, and nonsensical diagr...

18:21 · 15 maio 2026

OpenAI reorganiza lideranças para focar em agentes de IA e unificar plataformas

OpenAI announced yet another reorganization Friday, consolidating certain areas and making company president Greg Brockman the official lead of all th...

17:09 · 15 maio 2026

Experimentos com DJs de IA mostram riscos de confiar apenas em inteligência artificial

AI radio DJs demonstrated their volatile personalities. | Image: Cath Virginia / The Verge, Getty Images Andon Labs has been running a series of exper...

16:42 · 15 maio 2026

Google atualiza regras contra spam e manipulação de IA em resultados de busca

Google updated its spam policy to mark attempts to "manipulate" its AI model in search results as spam, including results in AI Overview or AI Mode in...

14:00 · 15 maio 2026

Podcast do Engadget: Quais são as novidades do Android 17?

We also dive into all the new features in Android 17.

Tecnologia

Fuga de dados do Mythos da Anthropic expõe fragilidade em segurança da IA