AI bije rekordy w autonomicznych cyberatakach – nowe modele zagrażają bezpieczeństwu

AI cyberbezpieczeństwo GPT-5.5 Claude Mythos AI Security Institute Palo Alto Networks autonomiczne ataki

Przełomowe osiągnięcia AI w autonomicznych cyberatakach

Dwa najnowocześniejsze modele sztucznej inteligencji – Claude Mythos Preview firmy Anthropic oraz GPT-5.5 od OpenAI – znacząco przewyższają dotychczasowe możliwości AI w zakresie autonomicznych zadań cybernetycznych. Wyniki badań opublikowane w środę przez AI Security Institute (AISI) oraz Palo Alto Networks wskazują na gwałtowne przyspieszenie tempa rozwoju AI w tej dziedzinie.

AI Security Institute: Nowe modele biją dotychczasowe trendy

AISI, instytucja odpowiedzialna za ocenę najnowocześniejszych modeli AI na zlecenie rządu brytyjskiego, stwierdziła, że zarówno Claude Mythos Preview, jak i GPT-5.5 znacznie przekroczyły dotychczasowe oczekiwania. Instytut szacował wcześniej, że niezawodność modeli AI w zakresie autonomicznych zadań cybernetycznych podwaja się co około pięć miesięcy. Teraz jednak nowe modele osiągają wyniki, które wykraczają poza dotychczasowe prognozy.

„Autonomiczne możliwości AI w zakresie cybernetyki i oprogramowania rozwijają się w zawrotnym tempie: czas trwania zadań cybernetycznych, które modele AI mogą wykonywać samodzielnie, podwaja się w skali miesięcy, a nie lat.”
– AI Security Institute

Najbardziej wymownym dowodem postępu są wyniki testów przeprowadzonych przez AISI w tzw. cyber ranges – symulacjach wieloetapowych ataków na małe, niechronione sieci przedsiębiorstw. Najnowsza wersja Claude Mythos Preview jako pierwszy model w historii ukończyła oba testy instytutu:

„The Last Ones” – symulowany atak na sieć korporacyjną składający się z 32 kroków – został rozwiązany w 6 na 10 prób;
„Cooling Tower” – dotychczas nierozwiązany przez żaden model – został ukończony w 3 na 10 prób.

Dla porównania, GPT-5.5 rozwiązał test „The Last Ones” w 3 na 10 prób.

Palo Alto Networks potwierdza przełomowe wyniki

Podobne wnioski płyną z badań przeprowadzonych przez Palo Alto Networks, które od kwietnia testuje Claude Mythos jako partner w ramach Project Glasswing firmy Anthropic. Firma przetestowała również Claude Opus 4.7 oraz GPT-5.5-Cyber w ramach programu Trusted Access for Cyber od OpenAI.

„Najnowsze modele AI są niezwykle skuteczne w wykrywaniu luk w zabezpieczeniach i przekształcaniu ich w krytyczne ścieżki exploita w czasie niemal rzeczywistym” – napisano w komunikacie firmy.

Palo Alto Networks zidentyfikowało dzięki AI łącznie 26 nowych CVE (Common Vulnerabilities and Exposures), obejmujących 75 luk w zabezpieczeniach, co stanowi znaczny wzrost w porównaniu do typowej miesięcznej liczby wykrywanych luk (zwykle mniej niż pięć). Wszystkie krytyczne luki w produktach SaaS zostały już załatane, a poprawki są dostępne dla produktów obsługiwanych przez klientów.

Ograniczenia i dalsze wyzwania

AISI podkreśla, że szacunki oparte są na stosunkowo niewielkiej liczbie modeli, a najtrudniejsze zadania w testach mają najmniej danych porównawczych z wynikami ludzkimi. Mimo to instytut twierdzi, że ogólny trend pozostaje niezmienny: nawet wykluczenie pojedynczego modelu z analizy wpływa na szacowany czas podwojenia wyników o mniej niż miesiąc.

Niezależne badania prowadzone przez METR, organizację non-profit monitorującą postępy AI w zakresie obsługi oprogramowania, również wskazują na gwałtowne przyspieszenie tempa rozwoju autonomicznych systemów AI.

Źródło: CyberScoop

← Poprzedni

Jets pozyskują doświadczonego wide receptora Tim Patrick

Następny →

Kash Patel pod ostrzałem w Senacie: alkohol, kłamstwa i testy wiarygod...

15:52 · 15 maja 2026

ArXiv wprowadza roczny zakaz publikacji za AI slop – nowe regulacje przeciw fałszywym badaniom

ArXiv, the open-access repository of preprint academic research, will ban authors of papers for a year if they submit obviously AI-generated work. Lat...

15:19 · 15 maja 2026

Za kulisami bloga: Nowa muzyka, awaria i nie tylko

This is Behind the Blog, where we share our behind-the-scenes thoughts about how a few of our top stories of the week came together. This week, we dis...

14:11 · 15 maja 2026

Cisco reaguje na atak zero-day — luka w Catalyst SD-WAN zagrożona przez aktywnych cyberprzestępców

Attackers returned once again to a common target with a massive user base by exploiting a max-severity zero-day vulnerability affecting Cisco Catalyst...

13:00 · 15 maja 2026

Mayo Clinic stosuje sztuczną inteligencję do rejestrowania wizyt na SOR-ze

Mayo Clinic, the massive U.S. hospital network, is using what it describes as “Ambient Listening” to record patient interactions with nurses, includin...

20:35 · 14 maja 2026

AI zaawansowany do stopnia rewolucji w wojnie: Pentagon ostrzega przed nowym zagrożeniem

Advanced artificial intelligence models will “fundamentally change warfare as we know it,” a top cyber official at the Defense Department said Thursda...

20:15 · 14 maja 2026

Ekspert Białego Domu: Bezpieczeństwo tożsamości kluczem w erze AI

As AI becomes more integrated into federal IT (and attacker toolsets) government agencies will need to focus their resources on regulating and monitor...

14:23 · 14 maja 2026

Foxconn potwierdza cyberatak na fabryki w Ameryce Północnej – ransomware Nitrogen ujawnia dane

Foxconn, one of the world’s largest manufacturers of electronics sold by major tech vendors, is recovering from a cyberattack that disrupted some of t...

13:30 · 14 maja 2026

Aplikacja AI analizująca kupę wystawiła na sprzedaż bazę danych 150 tysięcy zdjęć użytkowników

A few weeks ago, I came across a wild post on Reddit’s r/DHExchange, a subreddit for trading large datasets: “I hoarded a large database of something...

Cyberbezpieczeństwo

AI osiąga przełom w autonomicznych cyberatakach – nowe modele biją rekordy wydajności

Przełomowe osiągnięcia AI w autonomicznych cyberatakach

AI Security Institute: Nowe modele biją dotychczasowe trendy

Palo Alto Networks potwierdza przełomowe wyniki

Ograniczenia i dalsze wyzwania

Jets pozyskują doświadczonego wide receptora Tim Patrick

Kash Patel pod ostrzałem w Senacie: alkohol, kłamstwa i testy wiarygod...

Cyberbezpieczeństwo

AI osiąga przełom w autonomicznych cyberatakach – nowe modele biją rekordy wydajności

Przełomowe osiągnięcia AI w autonomicznych cyberatakach

AI Security Institute: Nowe modele biją dotychczasowe trendy

Palo Alto Networks potwierdza przełomowe wyniki

Ograniczenia i dalsze wyzwania

Jets pozyskują doświadczonego wide receptora Tim Patrick

Kash Patel pod ostrzałem w Senacie: alkohol, kłamstwa i testy wiarygod...

Powiązane artykuły

ArXiv wprowadza roczny zakaz publikacji za AI slop – nowe regulacje przeciw fałszywym badaniom

Za kulisami bloga: Nowa muzyka, awaria i nie tylko

Cisco reaguje na atak zero-day — luka w Catalyst SD-WAN zagrożona przez aktywnych cyberprzestępców

Mayo Clinic stosuje sztuczną inteligencję do rejestrowania wizyt na SOR-ze

AI zaawansowany do stopnia rewolucji w wojnie: Pentagon ostrzega przed nowym zagrożeniem

Ekspert Białego Domu: Bezpieczeństwo tożsamości kluczem w erze AI

Foxconn potwierdza cyberatak na fabryki w Ameryce Północnej – ransomware Nitrogen ujawnia dane

Aplikacja AI analizująca kupę wystawiła na sprzedaż bazę danych 150 tysięcy zdjęć użytkowników