Компания Anthropic, один из ведущих разработчиков искусственного интеллекта, объявила о выпуске новой модели Claude Mythos Preview. Однако доступ к ней будет предоставлен лишь ограниченному кругу организаций — в первую очередь, из-за опасений, что инструмент может быть использован злоумышленниками.
По словам разработчиков, модель изначально создавалась как универсальный ИИ, но в процессе тестирования выявила неожиданные способности в области кибербезопасности. Она эффективно обнаруживает критические уязвимости в программных системах любого типа, включая операционные системы и корпоративное ПО.
Риск заключается в том, что подобный инструмент может стать «дорожной картой» для хакеров, предоставляя им детализированные данные о слабых местах в защите крупнейших компаний. Чтобы предотвратить возможные атаки, Anthropic решила не распространять модель среди широкой аудитории.
Проект Glasswing — это инициатива, в рамках которой модель передается избранным участникам: технологическим гигантам, банкам и другим организациям, отвечающим за критически важную инфраструктуру. Среди них — Nvidia, JP Morgan Chase, Google и десятки других компаний, занимающихся разработкой и поддержкой программного обеспечения.
Как работает Claude Mythos? Несмотря на специализированные возможности, модель функционирует как стандартный ИИ-инструмент. Пользователи могут формулировать запросы, чтобы выявить уязвимости в своих системах. Например, команда Google Chrome может использовать её для поиска потенциальных брешей в браузере. Полученные данные затем применяются для устранения обнаруженных проблем.
Однако та же самая модель может быть использована хакерами для поиска уязвимостей с целью их эксплуатации. Именно поэтому Anthropic приняла решение о строгом контроле доступа к Mythos Preview.