קפיצת מדרגה בביצועי AI בתחום הסייבר האוטונומי
שני מודלי הבינה המלאכותית המתקדמים ביותר בעולם, Claude Mythos Preview של חברת אנטרופיק ו-GPT-5.5 של OpenAI, הצליחו להשיג ביצועים חסרי תקדים במשימות סייבר אוטונומיות. כך עולה מממצאים שפורסמו ביום רביעי האחרון על ידי המכון הבריטי לאבטחת AI (AISI) ועל ידי חברת Palo Alto Networks.
קצב ההתקדמות מואץ פי כמה
על פי הדו"ח של AISI, אשר מבצע הערכות טרום-הפצה של מודלי AI מתקדמים מטעם ממשלת בריטניה, שני המודלים החדשים הצליחו לעבור בקלות את קצב ההתקדמות המהיר בו צפה המכון מאז סוף שנת 2024. המכון העריך בתחילת השנה כי זמן האוטונומיה של מודלי AI במשימות סייבר, הנמדד באמצעות זמן ביצוע משימה על ידי מומחה אנושי, מוכפל כל חמישה חודשים בערך. קצב זה עצמו היה מהיר פי שניים מההערכה הקודמת של המכון מנובמבר 2023.
עתה, המודלים החדשים עוקפים כל מגמת התקדמות שנמדדה עד כה. "יכולות הסייבר והפיתוח התוכנה האוטונומיות של מודלי AI מתקדמים מתקדמות בקצב מהיר ביותר: אורך המשימות שהמודלים יכולים לבצע באופן אוטונומי מוכפל מדי חודשים, ולא שנים", נכתב בדו"ח של AISI.
הוכחות חותכות ממבחני הסייבר
ההוכחה הברורה ביותר לקפיצת המדרגה הגיעה ממבחני הסייבר של המכון הבריטי, אשר מדמים מתקפות רב-שלביות על רשתות ארגוניות קטנות וחשופות. גרסה חדשה של Claude Mythos Preview הפכה למודל הראשון שהצליח להשלים שני מבחנים אלו:
- במבחן "The Last Ones", אשר מדמה מתקפת רשת תאגידית בת 32 שלבים, הצליח המודל לפתור את המשימה ב-6 מתוך 10 ניסיונות.
- במבחן "Cooling Tower", אשר לא נפתר עד כה על ידי אף מודל, הצליח המודל להשלים את המשימה ב-3 מתוך 10 ניסיונות.
GPT-5.5 הצליח לפתור את מבחן "The Last Ones" ב-3 מתוך 10 ניסיונות.
אישוש ממחקרים עצמאיים
חברת Palo Alto Networks הגיעה למסקנות דומות במסגרת בדיקות עצמאיות. החברה החלה לבדוק את Claude Mythos באפריל כחלק מפרויקט Glasswing של אנטרופיק, ולאחר מכן בדקה גם את Claude Opus 4.7 ואת GPT-5.5-Cyber כחלק מתוכנית Trusted Access for Cyber של OpenAI.
"המודלים החדשים מצטיינים בזיהוי פגיעויות והפיכתן לנתיבי ניצול קריטיים בזמן אמת כמעט", נכתב בהודעת החברה. Palo Alto Networks פרסמה 26 ייעוצי אבטחה המכסים 75 בעיות אבטחה (CVE), בהשוואה לממוצע של פחות מחמישה ייעוצים בחודש, אשר זוהו באמצעות סריקות של מודלי AI ב-130 מוצרים שונים. כל הפגיעויות החשובות במוצרי SaaS שלה תוקנו, וכן זמינות תיקונים למוצרי לקוחות.
מגבלות והסתייגויות
ה-AISI הדגיש כי הנתונים מבוססים על מספר קטן יחסית של מודלים, וכי המשימות הקשות ביותר במבחני הסייבר חסרות נתוני השוואה אנושיים מספקים. עם זאת, המכון ציין כי המגמה הכללית נשמרת: גם אם מוציאים מודל בודד מהניתוח, קצב ההתקדמות המוכפל משתנה בפחות מחודש לכל כיוון.
מחקר נפרד שבוצע על ידי ארגון METR, העוקב אחר קצב ביצוע משימות תוכנה על ידי AI, אישר אף הוא את ממצאי המכון הבריטי.
"יכולות הסייבר האוטונומיות של מודלי AI מתקדמים מתקדמות בקצב שאינו מוכר קודם לכן. ההשלכות על תחום אבטחת הסייבר הן מרחיקות לכת ודורשות התייחסות מיידית."
— דו"ח המכון הבריטי לאבטחת AI (AISI)