AI bryter alle barrierer innen autonom cyberkapasitet
To av verdens mest avanserte AI-modeller, Claude Mythos Preview fra Anthropic og GPT-5.5 fra OpenAI, har ifølge nye rapporter fra britiske og amerikanske forskningsinstitutter revolusjonert måten AI-systemer løser autonome cyberoppgaver på. Resultatene, publisert onsdag, viser en eksponentiell økning i modellenes evne til å utføre komplekse cyberoperasjoner uten menneskelig inngripen.
Britisk institutt varsler om akselererende utvikling
Det britiske AI Security Institute (AISI), som gjennomfører forhåndsevalueringer av banebrytende AI-modeller på vegne av regjeringen, rapporterer at begge modellene har overgått alle tidligere målestokker. AISI har siden slutten av 2024 registrert en dobling av AI-systemers evne til å fullføre cyberoppgaver hvert femte måned. Nå har imidlertid Claude Mythos Preview og GPT-5.5 brutt denne trenden.
«Frontier AI’s autonome cyber- og programvarekapasitet utvikler seg raskt: Lengden på cyberoppgaver som frontmodeller kan fullføre autonomt, har doblet seg på månedsbasis, ikke årsbasis.»
– AI Security Institute (AISI)
Bevis på banebrytende prestasjoner
AISI benytter seg av såkalte cyber ranges – strukturerte simuleringer av flertrinnsangrep mot ubeskyttede bedriftsnettverk – for å teste modellene. Her har Claude Mythos Preview oppnådd enestående resultater:
- Løste oppgaven «The Last Ones» (en 32-trinns simulert bedriftsnettverksangrep) på 6 av 10 forsøk.
- Fullførte «Cooling Tower», en tidligere uløselig oppgave, på 3 av 10 forsøk.
GPT-5.5 løste «The Last Ones» på 3 av 10 forsøk.
Palo Alto Networks bekrefter funnene
Den amerikanske cybersikkerhetsgiganten Palo Alto Networks har gjennomført egne tester som støtter AISIs konklusjoner. Selskapet, som har vært en av de første til å teste Claude Mythos gjennom Project Glasswing, rapporterer at de nyeste modellene kan identifisere sårbarheter og omgjøre dem til kritiske eksploateringsveier i sanntid.
Gjennom AI-skanning av over 130 produkter har Palo Alto Networks identifisert 26 nye Common Vulnerabilities and Exposures (CVEs), som dekker 75 sikkerhetsproblemer. Dette er en betydelig økning sammenlignet med den typiske månedlige mengden på under fem CVEs. Alle kritiske sårbarheter i selskapets SaaS-produkter er allerede patchet, og oppdateringer er tilgjengelige for kundedrevne produkter.
Usikkerhet rundt fremtidig utvikling
AISI understreker at estimatene er basert på et begrenset antall modeller, og at de vanskeligste oppgavene har minst sammenligningsdata fra mennesker. Likevel konkluderer instituttet med at trenden er tydelig: Selv om man fjerner én modell fra analysen, endres den estimerte doblingstiden med mindre enn én måned.
Uavhengig forskning fra METR, en ideell organisasjon som overvåker AI-systemers evne til å håndtere programvareoppgaver, peker også mot en akselererende utvikling. Selv om resultatene er foreløpige, tyder de på at AI-systemers autonome kapasitet kan komme til å overskride menneskelige evner på flere områder innen kort tid.
Hva betyr dette for cybersecurity?
Eksperter advarer om at den raske utviklingen stiller nye krav til cybersikkerhet. Tradisjonelle metoder for å oppdage og motvirke trusler kan bli utilstrekkelige når AI-systemer selv kan utføre avanserte angrep. Samtidig åpner de nye modellene også for muligheter til å styrke forsvaret gjennom automatisert sårbarhetsanalyse og respons.
«Disse resultatene viser at vi må revurdere hvordan vi tilnærmer oss cybersikkerhet. AI-modeller som kan operere autonomt, krever nye strategier for beskyttelse og respons,» sier en talskvinne for Palo Alto Networks.