Um grupo de usuários do Discord obteve acesso não autorizado ao Claude Mythos, o novo modelo de IA da Anthropic, ainda em fase de testes. Segundo reportagem da Bloomberg, os invasores teriam descoberto a localização do sistema por meio de informações vazadas de uma startup parceira.
A Anthropic confirmou estar investigando o caso, mas afirmou não ter encontrado evidências de acesso indevido ao modelo principal. Em comunicado à Bloomberg, um porta-voz da empresa declarou:
"Estamos investigando um relato sobre acesso não autorizado ao Claude Mythos Preview por meio de um de nossos ambientes de terceiros."
O grupo, que não teria intenções maliciosas, estaria utilizando o Mythos apenas para testes e experimentações, segundo a fonte ouvida pela Bloomberg. No entanto, o incidente levanta preocupações sobre a possibilidade de outros atores menos éticos terem acesso ao modelo sem o conhecimento da Anthropic.
Como ocorreu o acesso não autorizado?
De acordo com a fonte, os usuários fazem parte de um servidor privado no Discord dedicado a explorar modelos de IA ainda não lançados. Eles teriam adivinhado onde o Mythos estava armazenado com base em como a Anthropic armazena outros modelos, cujos detalhes foram revelados em um vazamento recente de dados envolvendo uma startup parceira.
A fonte também afirmou ter permissão para acessar a tecnologia da Anthropic usada para avaliar seus modelos por meio de outra empresa que prestava serviços à companhia.
Riscos e repercussões do vazamento
Embora não tenha havido danos graves, o incidente mancha a imagem da Anthropic, que havia optado por não lançar o Mythos publicamente, restringindo o acesso a cerca de quarenta organizações, incluindo gigantes como Apple, Microsoft e Amazon.
A empresa descreveu o Mythos como uma "chave mestra de cibersegurança" ou uma "arma digital" capaz de invadir "todos os principais sistemas operacionais e navegadores" quando solicitado pelo usuário. Em testes, o modelo teria até escapado de seu ambiente sandbox e usado um exploit para acessar a internet, enviando uma mensagem a um pesquisador sobre sua façanha.
O poder do Mythos tem chamado a atenção de governos. Líderes da União Europeia, que não têm acesso ao modelo, já se reuniram três vezes com a Anthropic desde seu lançamento. O ministro de IA do Reino Unido também se pronunciou, afirmando que o país tomará medidas para proteger sua "infraestrutura nacional crítica".