Två av världens mest avancerade AI-modeller – Claude Mythos Preview från Anthropic och GPT-5.5 från OpenAI – har på kort tid revolutionerat förmågan att utföra autonoma cyberuppgifter. Enligt nyligen publicerade resultat från Storbritanniens AI Security Institute (AISI) och säkerhetsföretaget Palo Alto Networks har dessa modeller kraftigt överträffat tidigare prestandamätningar.
AISI, som utvärderar nya AI-system åt den brittiska regeringen, konstaterar att utvecklingen accelererar i en takt som överträffar alla tidigare prognoser. Sedan slutet av 2024 hade institutets mätningar visat att komplexiteten i cyberuppgifter som AI klarar av fördubblades ungefär var femte månad. Nu har dock Mythos Preview och GPT-5.5 slagit alla tidigare trender.
«Frontier-AI:ns förmåga att hantera cyberuppgifter autonomt utvecklas i en rasande fart. Den tid det tar för AI att slutföra komplexa uppgifter halveras nu på månader, inte år», skriver AISI i sitt uttalande.
Det tydligaste beviset på genombrottet kommer från AISIs cyber ranges – simulerade nätverksattacker som testar AI-systemens förmåga att hantera flerstegsattacker mot oskyddade företagsnätverk. I dessa tester lyckades Claude Mythos Preview lösa två av institutets mest utmanande scenarier:
- «The Last Ones», en 32-stegs simulerad attack mot ett företagsnätverk, klarades av i 6 av 10 försök.
- «Cooling Tower», som tidigare varit olöst av alla AI-modeller, klarades av i 3 av 10 försök.
GPT-5.5 klarade «The Last Ones» i 3 av 10 försök. Även Palo Alto Networks rapporterar liknande resultat från sina egna tester. Företaget har sedan april utvärderat Claude Mythos som en av de första externa aktörerna i Anthropics Project Glasswing, och har sedan dess även testat Claude Opus 4.7 och OpenAI:s GPT-5.5-Cyber inom ramen för OpenAIs Trusted Access for Cyber-program.
«De senaste modellerna är exceptionellt skickliga på att identifiera sårbarheter och omvandla dem till kritiska exploateringsvägar i nära realtid», skriver Palo Alto Networks i sitt uttalande. Företaget har under de senaste månaderna identifierat 26 nya säkerhetshål (CVEs) som täcker 75 olika sårbarheter – en siffra som vida överstiger det normala antalet på mindre än fem per månad. Samtliga kritiska sårbarheter i företagets SaaS-produkter har redan patchats, och uppdateringar finns tillgängliga för kunddrivna produkter.
AISI betonar dock att resultaten baseras på ett begränsat antal modeller och att de mest komplexa testerna har minst jämförande data från mänskliga experter. Trots detta håller trenden: att exkludera enskilda modeller från analysen påverkar inte den övergripande slutsatsen nämnvärt. Den beräknade fördubblingstiden förändras med mindre än en månad i båda riktningarna.
Separata forskningsresultat från den oberoende organisationen METR, som studerar AI:ns förmåga att hantera mjukvaruutveckling, tyder också på en accelererande utveckling. Experter varnar dock för att den snabba framgången inom AI-driven cybersäkerhet också innebär nya risker. «Om AI-system kan identifiera och utnyttja sårbarheter snabbare än någonsin, måste också motåtgärderna utvecklas i samma takt», säger en talesperson från AISI.