أظهرت اختبارات حديثة أن نماذج الذكاء الاصطناعي المتقدمة مثل Mythos من Anthropic وGPT-5.5-Cyber من OpenAI، لا تزال بحاجة إلى خبراء بشريين للتحقق من النتائج وتوجيهها، رغم قدرتها على اكتشاف ثغرات أمنية متعددة.
وقد كشفت الاختبارات في بيئات حقيقية أن هذه النماذج، رغم قوتها، لا تزال تعتمد بشكل كبير على التدخل البشري لتحديد الثغرات القابلة للاستغلال وتجنب النتائج الخاطئة. وأشار الباحثون إلى أن المرحلة الجديدة من الأمن السيبراني المدعوم بالذكاء الاصطناعي قد تعتمد بشكل أقل على الاختراق التلقائي وأكثر على كيفية توجيه البشر لهذه الأنظمة وتفعيلها بشكل صحيح.
اكتشافات ثغرات غير مسبوقة
عندما أطلقت Anthropic نموذج Mythos Preview، حذرت من أن قوته قد تؤدي إلى اكتشاف عشرات الآلاف من الثغرات في مختلف أنظمة التشغيل. وأظهرت اختبارات مستقلة أن نموذج GPT-5.5-Cyber من OpenAI يتمتع بقدرات مماثلة في اكتشاف الثغرات وكتابة استغلالاتها.
وقد سارع العديد من الشركات والحكومات حول العالم للحصول على هذه النماذج لفهم التهديدات المحتملة التي قد تواجهها بمجرد انتشار هذه القدرات بين المهاجمين.
تجارب الشركات الرائدة
شارك عدد من الشركات التي اختبرت هذه النماذج تجاربها هذا الأسبوع:
- Palo Alto Networks: اكتشفت 75 ثغرة باستخدام نماذج Anthropic وOpenAI، مقارنةً بـ5 إلى 10 ثغرات فقط في الشهر الواحد قبل استخدام هذه النماذج. كما لاحظت أن النماذج أصبحت قادرة على ربط ثغرات منخفضة الخطورة لتشكيل سلاسل هجوم قابلة للاستغلال.
- Microsoft: أعلنت عن نظام أمان جديد يعتمد على نماذج ذكاء اصطناعي متقدمة، حيث اكتشف 16 ثغرة جديدة في نظامي Windows للشبكات والمصادقة. وحذرت الشركة من أن أدوات الذكاء الاصطناعي ستزيد من حجم الثغرات المكتشفة بمرور الوقت، مما يضع ضغطًا إضافيًا على المدافعين لتقييمها وتصحيحها بسرعة.
- Cisco: أطلقت Foundry Security Spec، وهو إطار عمل مفتوح المصدر يوضح كيفية استخدام نماذج الذكاء الاصطناعي المتقدمة في الأمن السيبراني.
- XBOW: startup متخصصة في اختبار الاختراق المدعوم بالذكاء الاصطناعي، وصفت Mythos بأنها «قوية للغاية في تدقيق أكواد المصدر» بناءً على اختباراتها الداخلية.
الواقع: الحاجة إلى التدخل البشري
أكدت جميع الشركات أن النماذج تعمل بأفضل أداء عند دمجها مع باحثين أمنيين ذوي خبرة، الذين يمكنهم التحقق من النتائج وتوجيه سير العمل وتمييز الثغرات القابلة للاستغلال عن الضوضاء.
وذكرت XBOW أن Mythos «جيدة ولكنها أقل قوة في التحقق من الاستغلال»، كما أنها قد تكون «مفرطة في الدقة والتحفظ»، مما يؤدي في بعض الأحيان إلى المبالغة في أهمية نتائجها.
أما Palo Alto Networks، التي تعمل مع Mythos وOpus 4.7 وGPT-5.5-Cyber، فقد سجلت معدل إيجابية كاذبة بنسبة 30% في منتجاتها، على الرغم من أن هذا المعدل انخفض بعد تدريب النموذج على البيئة التي يتم البحث فيها.
وقال Daniel Stenberg، المطور الرئيسي لمشروع Curl مفتوح المصدر، إن Mythos اكتشف ثغرة منخفضة الخطورة في كود المشروع، بالإضافة إلى العديد من الإيجابيات الكاذبة وقضية أخرى اعتبرها الفريق غير مهمة، مما يبرز الحاجة إلى المراجعة البشرية.
تحليل Cisco: لماذا لا يكفي الاعتماد على النماذج وحدها؟
في وثائق المواصفات الخاصة بإطار العمل الجديد من Cisco، كشفت الشركة عن قدرات النماذج الجديدة، قائلة: «النموذج المتقدم ينتج ادعاءات ثغرات fluent وثقيلة ومقنعة، لكنها خاطئة بنسبة تجعل المخرجات غير المراجعة عديمة الفائدة».
وأشارت الشركة إلى أن الحل لا يكمن في مطالبة النماذج بأن تكون أكثر حذرًا، بل في توجيهها لإنتاج ادعاءات «قابلة للتحقق»، ثم الاعتماد على البشر لفحصها بدقة.