في الشهر الماضي، أثارت شركة Anthropic ضجة كبيرة حول التهديدات السيبرانية المزعومة التي يمثلها نموذجها التجريبي Mythos Preview. ونتيجة لذلك، اقتصرت الشركة الإصدار الأولي للنموذج على «شركاء الصناعة الحيوية» فقط.

لكن، كشفت أبحاث جديدة أجراها معهد الأمن السيبراني البريطاني (AISI) أن نموذج GPT-5.5 من OpenAI، والذي أُطلق للجمهور الأسبوع الماضي، قد حقق «مستوى أداء مماثلاً» في اختباراته السيبرانية لنموذج Mythos Preview، الذي اختبره المعهد الشهر الماضي.

نتائج الاختبارات السيبرانية

منذ عام 2023، يخضع نماذج الذكاء الاصطناعي المتقدمة لـ AISI لاختباراتCapture the Flag (CTF) التي تشمل 95 مهمة مختلفة لقياس قدراتها في مهام أمنية مثل الهندسة العكسية واستغلال الثغرات والبرمجة المشفرة.

في المهام «الخبير» الأكثر صعوبة، نجح نموذج GPT-5.5 في حل 71.4% من التحديات، متفوقاً قليلاً على Mythos Preview الذي حل 68.6% من المهام (على الرغم من أن الفارق يقع ضمن هامش الخطأ). وفي مهمة صعبة للغاية تطلبت بناء «مفكك تجميع» لفك تشفير ملف ثنائي بلغة Rust، تمكن GPT-5.5 من حل التحدي في 10 دقائق و22 ثانية دون أي مساعدة بشرية، بتكلفة قدرها 1.73 دولار في مكالمات API.

نجاحات في سيناريوهات الهجوم المتقدمة

كما تفوق GPT-5.5 على Mythos Preview في اختبار «آخرون» (TLO)، وهو نطاق محاكاة أعده AISI لمحاكاة هجوم استخراج بيانات مكون من 32 خطوة على شبكة شركة. نجح GPT-5.5 في 3 من أصل 10 محاولات، مقارنة بـ 2 من أصل 10 لنموذج Mythos Preview. ولم ينجح أي نموذج ذكاء اصطناعي سابق في هذا الاختبار من قبل.

ومع ذلك، فشل GPT-5.5 في اختبار «برج التبريد» الأكثر صعوبة، والذي يحاكي محاولة تعطيل نظام التحكم في محطة للطاقة. وقد فشل جميع نماذج الذكاء الاصطناعي السابقة في هذا الاختبار أيضاً.

دلالات النتائج

تشير هذه النتائج إلى أن المخاوف السابقة بشأن التهديدات السيبرانية التي يمثلها نموذج Mythos Preview قد تكون مبالغاً فيها. فبدلاً من ذلك، يظهر GPT-5.5 قدرة تنافسية عالية في المهام السيبرانية المتقدمة، مما يثير تساؤلات حول مدى جدية المخاطر التي يشكلها الذكاء الاصطناعي في المجال الأمني.

ويؤكد المعهد أن هذه الاختبارات تهدف إلى تقييم قدرات نماذج الذكاء الاصطناعي في مواجهة التهديدات السيبرانية الحقيقية، وليس مجرد تقييم أدائها النظري.

المصدر: Ars Technica