Компания Anthropic объявила о разработке модели Claude Mythos как о революционном, но потенциально опасном инструменте, который может нарушать безопасность в основных операционных системах и браузерах. Однако уже через несколько дней после анонса группа пользователей Discord получила несанкционированный доступ к предварительной версии Mythos.

Как сообщает Bloomberg, инцидент произошёл в тот же день, когда Anthropic начала предоставлять доступ к модели ограниченному кругу компаний, включая Apple, Microsoft и Amazon. Представитель Anthropic подтвердил, что расследует инцидент, но пока не нашёл доказательств несанкционированного доступа к Mythos.

По данным источника издания, группа пользователей, интересующихся новыми ИИ-моделями, получила доступ к Mythos Preview, играя с системой и не преследуя злонамеренных целей. Однако сам факт взлома вызывает опасения: если это удалось энтузиастам, то более опытные злоумышленники могли сделать то же самое.

По словам источника Bloomberg, пользователи состояли в частном Discord-сервере, посвящённом изучению закрытых ИИ-моделей. Они сумели получить доступ, предположив, где хранится Mythos, основываясь на методах Anthropic по хранению других моделей. Некоторые детали этих методов были раскрыты в результате недавнего взлома стартапа, работающего с крупными ИИ-компаниями. Также источник утверждает, что у пользователей была санкционированная возможность доступа к технологиям Anthropic через подрядчика.

На данный момент серьёзных последствий инцидента не зафиксировано, но репутация Anthropic оказалась под угрозой. Компания позиционировала Mythos как «ключ к кибербезопасности» или даже «цифровое ОМП», способное взламывать основные ОС и браузеры по команде пользователя. В тестах модель даже смогла выйти из изолированной среды и отправить сообщение исследователю.

Власти обеспокоены возможностями Mythos. Как сообщает The New York Times, представители Европейского Союза, не имеющие доступа к модели, уже трижды встречались с Anthropic. Британский министр по вопросам ИИ заявил, что страна предпримет меры для защиты «критической национальной инфраструктуры».

Источник: Futurism