AI-modeller revolutionerer cybersecurity – men mennesker er stadig nødvendige
Selv de mest avancerede AI-modeller inden for cybersecurity, herunder Anthropics Mythos og OpenAIs GPT-5.5-Cyber, kræver betydelig menneskelig ekspertise for at fungere effektivt. Det viser nye undersøgelser baseret på tests i virkelige miljøer. Selvom modellerne kan identificere tusindvis af sårbarheder, er det menneskelige indblik fortsat afgørende for at validere og operationalisere resultaterne.
De nye AI-modeller er kraftfulde – men ikke perfekte
Da Anthropic lancerede Mythos Preview, advarede selskabet om, at modellen var så kraftfuld, at den kunne finde tusindvis af sårbarheder på tværs af næsten alle operativsystemer. Tredjeparts-tests viser, at OpenAIs GPT-5.5-Cyber er lige så effektiv til at opdage sårbarheder og skrive exploits. Store virksomheder og regeringer verden over har været ivrige efter at få adgang til disse modeller for at forstå, hvilke trusler de står overfor, når lignende teknologier kommer i hænderne på angribere.
Virksomheder tester modellerne i praksis
Flere tidlige brugere af Mythos og GPT-5.5 har i denne uge delt deres erfaringer fra test af de tilsyneladende revolutionerende modeller:
- Palo Alto Networks opdagede 75 sårbarheder ved hjælp af både Anthropics og OpenAIs modeller – sammenlignet med de sædvanlige 5-10 sårbarheder, de finder hver måned. Forskerne fandt også, at modellerne kunne koble tilsyneladende mindre alvorlige sårbarheder sammen til fungerende angrebskæder.
- Microsoft meddelte tirsdag, at dets nye agentiske sikkerhedssystem, der kører på flere avancerede og distillerede modeller, havde fundet 16 nye sårbarheder i Windows netværks- og autentificeringssystem. Microsoft advarede også om, at AI-værktøjer sandsynligvis vil øge det samlede antal opdagede sårbarheder over tid, hvilket lægger ekstra pres på forsvarere til hurtigere at prioritere og patch’e fejl.
- Cisco offentliggjorde denne uge "Foundry Security Spec", en open-source-vejledning til, hvordan organisationer bør integrere avancerede AI-modeller i deres sikkerhedsstrategier.
- XBOW, en AI-drevet penetrationstest-virksomhed, betegnede Mythos som "ekstremt kraftfuld til kildekode-revisioner" i et blogindlæg tirsdag, hvor de beskrev deres interne tests.
Menneskelig ekspertise er fortsat uundværlig
På trods af de imponerende resultater viste undersøgelserne, at modellerne fungerede bedst, når de blev parret med erfarne sikkerhedsforskere. Disse eksperter kunne validere resultater, guide arbejdsgange og skelne mellem reelle trusler og støj.
XBOW fandt eksempelvis, at Mythos var "god, men mindre effektiv til at validere exploits" og kunne være "for bogstavelig og konservativ". Modellen havde desuden en tendens til at overvurdere betydningen af sine fund. Palo Alto Networks rapporterede en false positive-rate på omkring 30% i sine produkter, skønt denne rate faldt, efterhånden som modellen blev trænet på det specifikke miljø, den skulle undersøge.
"En grænseoverskridende model producerer flydende, selvsikre og plausible påstande om sårbarheder, der er forkerte i en grad, der gør ureviewet output værdiløst."
— Cisco, i specifikationen for "Foundry Security Spec"
Ciscos forskere fandt, at resultaterne blev bedre, når de instruerede systemerne til at gøre deres påstande "kontrollerbare" frem for blot at bede modellerne om at være mere forsigtige.
Eksempler på AI-modellernes begrænsninger
Daniel Stenberg, hovedudvikleren bag det open-source-projekt Curl, fortalte mandag, at Mythos havde fundet en lav-alvorligheds sårbarhed i Curls kode sammen med flere false positives og en anden issue, som Curl endte med at betragte som uvæsentlig. Dette understreger, hvor meget menneskelig gennemgang der stadig er nødvendig.
Fremtidens cybersecurity kræver samspil mellem AI og mennesker
Selvom AI-modellerne kan identificere sårbarheder hurtigere og mere omfattende end nogensinde før, viser de nye tests, at menneskelig ekspertise fortsat er afgørende. Virksomheder og regeringer må derfor investere i både avancerede AI-værktøjer og erfarne sikkerhedsfagfolk for at holde trit med de stadigt mere sofistikerede trusler.