Лондон, Великобритания — Две передовые модели искусственного интеллекта — Claude Mythos Preview от Anthropic и GPT-5.5 от OpenAI — значительно превысили текущие темпы развития автономных кибертехнологий. Об этом сообщают независимые исследования, опубликованные в среду Британским институтом безопасности ИИ (AISI) и компанией Palo Alto Networks.

AISI, занимающийся предварительной оценкой передовых ИИ-моделей для британского правительства, заявил, что обе модели превысили ранее зафиксированные темпы удвоения производительности. До этого институт прогнозировал, что надежность автономных киберзадач у передовых моделей удваивается каждые пять месяцев. Теперь же Mythos Preview и GPT-5.5 демонстрируют результаты, превосходящие все предыдущие прогнозы.

«Автономные кибервозможности передовых ИИ-моделей развиваются стремительно: время выполнения задач, которые могут решаться без вмешательства человека, удваивается не за годы, а за месяцы», — отмечается в отчете AISI.

Результаты испытаний: новые рекорды

Наиболее яркие доказательства скачка возможностей были получены в ходе киберполигонов AISI — структурированных симуляций многоэтапных атак на уязвимые корпоративные сети. Новая версия Claude Mythos Preview стала первой моделью, сумевшей пройти оба теста института:

  • Задача «The Last Ones» (32-этапная атака на корпоративную сеть) была решена в 6 из 10 попыток;
  • Задача «Cooling Tower», ранее не поддававшаяся ни одной модели, была решена в 3 из 10 попыток.

GPT-5.5 справился с «The Last Ones» в 3 из 10 попыток. Аналогичные выводы были сделаны и в Palo Alto Networks, которая проводила собственные тесты.

Экспертная оценка возможностей

Компания Palo Alto Networks начала тестирование Claude Mythos в апреле в рамках партнерства с Anthropic по проекту Project Glasswing. Позднее были протестированы Claude Opus 4.7 и GPT-5.5-Cyber в рамках программы OpenAI Trusted Access for Cyber.

По словам экспертов, новые модели демонстрируют исключительную способность находить уязвимости и преобразовывать их в критические эксплойты в режиме, близком к реальному времени. За время тестирования было выявлено 26 уязвимостей (CVE), охватывающих 75 проблем — это в разы больше, чем обычно фиксируется в месяц.

Все критически важные уязвимости в SaaS-продуктах были устранены, а патчи доступны для продуктов, эксплуатируемых клиентами.

Ограничения и перспективы

AISI подчеркнул, что данные основаны на небольшом количестве моделей, а самые сложные задачи имеют минимальные сравнительные данные от человека. Тем не менее, даже при исключении одной модели из анализа общая тенденция сохраняется: расчетное время удвоения производительности меняется менее чем на месяц.

Отдельные исследования, проведенные METR (некоммерческой организацией, отслеживающей прогресс ИИ в области программирования), также подтверждают ускоренное развитие технологий.

«Современные ИИ-модели не только догоняют человека в решении киберзадач, но и превосходят его по темпам выполнения. Это ставит новые вызовы перед специалистами по кибербезопасности», — заявил представитель AISI.

Источник: CyberScoop