Przełomowe osiągnięcia AI w autonomicznych cyberatakach

Dwa najnowocześniejsze modele sztucznej inteligencji – Claude Mythos Preview firmy Anthropic oraz GPT-5.5 od OpenAI – znacząco przewyższają dotychczasowe możliwości AI w zakresie autonomicznych zadań cybernetycznych. Wyniki badań opublikowane w środę przez AI Security Institute (AISI) oraz Palo Alto Networks wskazują na gwałtowne przyspieszenie tempa rozwoju AI w tej dziedzinie.

AI Security Institute: Nowe modele biją dotychczasowe trendy

AISI, instytucja odpowiedzialna za ocenę najnowocześniejszych modeli AI na zlecenie rządu brytyjskiego, stwierdziła, że zarówno Claude Mythos Preview, jak i GPT-5.5 znacznie przekroczyły dotychczasowe oczekiwania. Instytut szacował wcześniej, że niezawodność modeli AI w zakresie autonomicznych zadań cybernetycznych podwaja się co około pięć miesięcy. Teraz jednak nowe modele osiągają wyniki, które wykraczają poza dotychczasowe prognozy.

„Autonomiczne możliwości AI w zakresie cybernetyki i oprogramowania rozwijają się w zawrotnym tempie: czas trwania zadań cybernetycznych, które modele AI mogą wykonywać samodzielnie, podwaja się w skali miesięcy, a nie lat.”

– AI Security Institute

Najbardziej wymownym dowodem postępu są wyniki testów przeprowadzonych przez AISI w tzw. cyber ranges – symulacjach wieloetapowych ataków na małe, niechronione sieci przedsiębiorstw. Najnowsza wersja Claude Mythos Preview jako pierwszy model w historii ukończyła oba testy instytutu:

  • „The Last Ones” – symulowany atak na sieć korporacyjną składający się z 32 kroków – został rozwiązany w 6 na 10 prób;
  • „Cooling Tower” – dotychczas nierozwiązany przez żaden model – został ukończony w 3 na 10 prób.

Dla porównania, GPT-5.5 rozwiązał test „The Last Ones” w 3 na 10 prób.

Palo Alto Networks potwierdza przełomowe wyniki

Podobne wnioski płyną z badań przeprowadzonych przez Palo Alto Networks, które od kwietnia testuje Claude Mythos jako partner w ramach Project Glasswing firmy Anthropic. Firma przetestowała również Claude Opus 4.7 oraz GPT-5.5-Cyber w ramach programu Trusted Access for Cyber od OpenAI.

„Najnowsze modele AI są niezwykle skuteczne w wykrywaniu luk w zabezpieczeniach i przekształcaniu ich w krytyczne ścieżki exploita w czasie niemal rzeczywistym” – napisano w komunikacie firmy.

Palo Alto Networks zidentyfikowało dzięki AI łącznie 26 nowych CVE (Common Vulnerabilities and Exposures), obejmujących 75 luk w zabezpieczeniach, co stanowi znaczny wzrost w porównaniu do typowej miesięcznej liczby wykrywanych luk (zwykle mniej niż pięć). Wszystkie krytyczne luki w produktach SaaS zostały już załatane, a poprawki są dostępne dla produktów obsługiwanych przez klientów.

Ograniczenia i dalsze wyzwania

AISI podkreśla, że szacunki oparte są na stosunkowo niewielkiej liczbie modeli, a najtrudniejsze zadania w testach mają najmniej danych porównawczych z wynikami ludzkimi. Mimo to instytut twierdzi, że ogólny trend pozostaje niezmienny: nawet wykluczenie pojedynczego modelu z analizy wpływa na szacowany czas podwojenia wyników o mniej niż miesiąc.

Niezależne badania prowadzone przez METR, organizację non-profit monitorującą postępy AI w zakresie obsługi oprogramowania, również wskazują na gwałtowne przyspieszenie tempa rozwoju autonomicznych systemów AI.

Źródło: CyberScoop