מודלים חדשים של AI לסייבר: מהפכה או סיוע אנושי?

מודלים מתקדמים של AI לסייבר, שפותחו על ידי אנטרופיק ואופנאי, מגלים יכולות מרשימות ביותר בזיהוי פגיעויות ובכתיבת ניצוליהן. עם זאת, מחקרים חדשים מראים כי למרות הכוח הטמון בהם, הם עדיין דורשים התערבות אנושית משמעותית כדי להפוך לכלי יעיל באמת.

הכוח הטמון במודלים החדשים

כאשר אנטרופיק חשפה את Mythos Preview, היא הזהירה כי המודל חזק כל כך עד שהוא הצליח לגלות עשרות אלפי פגיעויות כמעט בכל מערכות ההפעלה הקיימות. בדיקות צד שלישי הראו כי GPT-5.5-Cyber של אופנאי מצליח באותה מידה בזיהוי פגיעויות ובכתיבת ניצולין. חברות ענק וממשלות ברחבי העולם נלחמות כדי להשיג גישה למודלים אלו, מתוך הבנה כי יכולות דומות עלולות ליפול לידיים עוינות בעתיד הקרוב.

תוצאות מבדיקות ראשוניות

כמה ממקבלי הגישה המוקדמים למודלים אלו שיתפו את חוויותיהם השבוע. Palo Alto Networks דיווחה כי באמצעות המודלים של אנטרופיק ואופנאי, היא הצליחה לגלות 75 פגיעויות – לעומת 5-10 פגיעויות בלבד שמתגלות בדרך כלל בחודש. החוקרים גילו גם כי המודלים הופכים להיות מסוגלים יותר ויותר לחבר פגיעויות שנראות חמורות נמוך לכדי שרשראות תקיפה עובדות.

Microsoft הודיעה ביום שלישי כי מערכת האבטחה החדשה שלה, המבוססת על מספר מודלים מתקדמים, הצליחה לגלות 16 פגיעויות חדשות במחסנית הרשת והאימות של Windows. החברה הזהירה כי כלים מבוססי AI צפויים להגדיל את נפח הפגיעויות שיתגלו עם הזמן, וליצור לחץ נוסף על הגנת הרשתות למיין ולטפל בפגמים במהירות רבה יותר.

Cisco פרסמה השבוע את Foundry Security Spec – מסמך פתוח המציע הנחיות לארגונים כיצד לשלב מודלים מתקדמים של AI במערכות האבטחה שלהם. XBOW, סטארטאפ המתמחה בבדיקות חדירה מבוססות AI, ציינה בבלוג שלה כי Mythos הוא "כלי רב עוצמה לבדיקות קוד מקור".

המגבלה האנושית: מדוע אנשים עדיין חיוניים?

למרות הכוח הטמון במודלים אלו, בדיקות הראו כי הם מצליחים בצורה הטובה ביותר כאשר הם מלווים במחקרי אבטחה מנוסים שיכולים לאמת את התוצאות, להנחות את תהליכי העבודה ולהבחין בין פגיעויות מנצלות לבין רעשים. XBOW מצאה כי Mythos "טוב פחות באימות ניצולין" וכי לעיתים המודל יכול להיות "אנין מדי ושמרני", לעיתים קרובות מגזים בחשיבות המעשית של ממצאיו.

Palo Alto Networks, שעובדת עם Mythos, Opus 4.7 ו-GPT-5.5-Cyber, דיווחה על שיעור גבוה של תוצאות חיוביות שווא – כ-30% – אם כי השיעור ירד כאשר החברה אימנה את המודל על הסביבה הספציפית בה הוא פעל.

Daniel Stenberg, המפתח הראשי של פרויקט הקוד הפתוח Curl, אמר ביום שני כי Mythos הצליח לגלות פגיעות חמורה נמוך בקודו לצד מספר תוצאות חיוביות שווא ובעיה נוספת שבסופו של דבר נחשבה חסרת חשיבות – מה שמדגיש את הצורך בבדיקה אנושית מעמיקה.

הדרך קדימה: שילוב בין AI לאנושיות

מסמכי המפרט של Cisco מספקים רמזים לגבי יכולותיהם של המודלים החדשים. החברה כתבה כי "מודל מתקדם מייצר טענות אמינות ושוטפות לפגיעויות, אך שגויות בשיעור שגורם לתוצאות שלא נבדקות להיות חסרות ערך". במקום להורות למודלים להיות זהירים יותר, החוקרים מצאו כי תוצאות טובות יותר מושגות כאשר המערכות מתבקשות לייצר טענות "ניתנות לבדיקה".

לסיכום, למרות ההתקדמות המהירה בתחום ה-AI לסייבר, נראה כי אנושיות עדיין נותרת גורם קריטי. המודלים החדשים יכולים להיות כלי רב עוצמה, אך הם דורשים הכוונה, בדיקה ואימות אנושיים כדי להפוך לאפקטיביים באמת. האתגר העתידי יהיה למצוא את האיזון הנכון בין כוח המחשוב לבין החוכמה האנושית.

מקור: Axios