GPT-5.5 يتفوق على Mythos Preview في اختبارات الأمن السيبراني: ما دلالات النتائج؟

ذكاء اصطناعي OpenAI أمن سيبراني هجمات سيبرانية Anthropic نماذج لغوية كبيرة Mythos Preview GPT-5.5 اختبارات AISI

في الشهر الماضي، أثارت شركة Anthropic ضجة كبيرة حول التهديدات السيبرانية المزعومة التي يمثلها نموذجها التجريبي Mythos Preview. ونتيجة لذلك، اقتصرت الشركة الإصدار الأولي للنموذج على «شركاء الصناعة الحيوية» فقط.

لكن، كشفت أبحاث جديدة أجراها معهد الأمن السيبراني البريطاني (AISI) أن نموذج GPT-5.5 من OpenAI، والذي أُطلق للجمهور الأسبوع الماضي، قد حقق «مستوى أداء مماثلاً» في اختباراته السيبرانية لنموذج Mythos Preview، الذي اختبره المعهد الشهر الماضي.

نتائج الاختبارات السيبرانية

منذ عام 2023، يخضع نماذج الذكاء الاصطناعي المتقدمة لـ AISI لاختباراتCapture the Flag (CTF) التي تشمل 95 مهمة مختلفة لقياس قدراتها في مهام أمنية مثل الهندسة العكسية واستغلال الثغرات والبرمجة المشفرة.

في المهام «الخبير» الأكثر صعوبة، نجح نموذج GPT-5.5 في حل 71.4% من التحديات، متفوقاً قليلاً على Mythos Preview الذي حل 68.6% من المهام (على الرغم من أن الفارق يقع ضمن هامش الخطأ). وفي مهمة صعبة للغاية تطلبت بناء «مفكك تجميع» لفك تشفير ملف ثنائي بلغة Rust، تمكن GPT-5.5 من حل التحدي في 10 دقائق و22 ثانية دون أي مساعدة بشرية، بتكلفة قدرها 1.73 دولار في مكالمات API.

نجاحات في سيناريوهات الهجوم المتقدمة

كما تفوق GPT-5.5 على Mythos Preview في اختبار «آخرون» (TLO)، وهو نطاق محاكاة أعده AISI لمحاكاة هجوم استخراج بيانات مكون من 32 خطوة على شبكة شركة. نجح GPT-5.5 في 3 من أصل 10 محاولات، مقارنة بـ 2 من أصل 10 لنموذج Mythos Preview. ولم ينجح أي نموذج ذكاء اصطناعي سابق في هذا الاختبار من قبل.

ومع ذلك، فشل GPT-5.5 في اختبار «برج التبريد» الأكثر صعوبة، والذي يحاكي محاولة تعطيل نظام التحكم في محطة للطاقة. وقد فشل جميع نماذج الذكاء الاصطناعي السابقة في هذا الاختبار أيضاً.

دلالات النتائج

تشير هذه النتائج إلى أن المخاوف السابقة بشأن التهديدات السيبرانية التي يمثلها نموذج Mythos Preview قد تكون مبالغاً فيها. فبدلاً من ذلك، يظهر GPT-5.5 قدرة تنافسية عالية في المهام السيبرانية المتقدمة، مما يثير تساؤلات حول مدى جدية المخاطر التي يشكلها الذكاء الاصطناعي في المجال الأمني.

ويؤكد المعهد أن هذه الاختبارات تهدف إلى تقييم قدرات نماذج الذكاء الاصطناعي في مواجهة التهديدات السيبرانية الحقيقية، وليس مجرد تقييم أدائها النظري.

المصدر: Ars Technica

← السابق

شيلو ساندرز يرد على ماري كاي كابوت بعد انتقادها لدشاون واتسون: "اذهبي...

ندوة سفيتاس: آراء حول خطاب القاضي توماس بمناسبة الذكرى 250 لإعلان الاستقلال

06:08 · 15 مايو 2026

شركة إكس أي آي تطلق مساعدها البرمجي الجديد غروك بيلد

It's in early beta and only available to SuperGrok Heavy subscribers right now.

22:21 · 14 مايو 2026

محاكمة ماسك ضد ألتمان: حجج ختامية فوضوية وسقوط قانوني محرج

Today was closing arguments in the Musk v. Altman trial, and I almost feel bad writing about the unbelievable demolition derby I just witnessed. Steve...

21:08 · 14 مايو 2026

ميتا تتيح كتابة الرسائل بالإيماءات لزجاجاتها الذكية رэй-بان ديسپلی

Meta is rolling out new features to its Meta Ray-Ban Display smart glasses, including bringing the ability to write messages just with hand gestures t...

21:02 · 14 مايو 2026

توأم من القراصنة يفقدان السيطرة: تسجيلTeams يكشف جرائمهما بعد فصلهما

Perhaps you remember Muneeb and Sohaib Akhter, the 34-year-old twin brothers we profiled earlier this week. Although they had the tech chops to commit...

20:59 · 14 مايو 2026

جائزة «المتسكع» لإيلون ماسك في محاكمةOpenAI: التفاصيل الكاملة

Yesterday, in Musk v. Altman, before the jurors came in, Sam Altman's team passed up what looked - from a distance - like a little league trophy. It w...

20:55 · 14 مايو 2026

ميتا تتيح تثبيت تطبيقات و ألعاب من جهات خارجية على نظارتها الذكية

The $800 smart glasses could soon be a lot more useful.

20:00 · 14 مايو 2026

أوبن أيه آي تطلق تطبيق كودكس للهواتف الذكية لمتابعة المشاريع البرمجية

The integration allows you to keep tabs on your coding projects on the go.

20:00 · 14 مايو 2026

أوبن إيه آي تدمج كودكس في تطبيق جات جي بي تي للهواتف الذكية

OpenAI is going to let users access Codex, its desktop AI tool that can write code and use apps on your computer, from the ChatGPT app on your phone....

تكنولوجيا

اختبارات أمنية جديدة: GPT-5.5 يتفوق على نموذج Mythos Preview في المهام السيبرانية

نتائج الاختبارات السيبرانية

نجاحات في سيناريوهات الهجوم المتقدمة

دلالات النتائج

شيلو ساندرز يرد على ماري كاي كابوت بعد انتقادها لدشاون واتسون: "اذهبي...

ندوة سفيتاس: آراء حول خطاب القاضي توماس بمناسبة الذكرى 250 لإعلان الاس...

تكنولوجيا

اختبارات أمنية جديدة: GPT-5.5 يتفوق على نموذج Mythos Preview في المهام السيبرانية

نتائج الاختبارات السيبرانية

نجاحات في سيناريوهات الهجوم المتقدمة

دلالات النتائج

شيلو ساندرز يرد على ماري كاي كابوت بعد انتقادها لدشاون واتسون: "اذهبي...

ندوة سفيتاس: آراء حول خطاب القاضي توماس بمناسبة الذكرى 250 لإعلان الاس...

أخبار ذات صلة

شركة إكس أي آي تطلق مساعدها البرمجي الجديد غروك بيلد

محاكمة ماسك ضد ألتمان: حجج ختامية فوضوية وسقوط قانوني محرج

ميتا تتيح كتابة الرسائل بالإيماءات لزجاجاتها الذكية رэй-بان ديسپلی

توأم من القراصنة يفقدان السيطرة: تسجيلTeams يكشف جرائمهما بعد فصلهما

جائزة «المتسكع» لإيلون ماسك في محاكمةOpenAI: التفاصيل الكاملة

ميتا تتيح تثبيت تطبيقات و ألعاب من جهات خارجية على نظارتها الذكية

أوبن أيه آي تطلق تطبيق كودكس للهواتف الذكية لمتابعة المشاريع البرمجية

أوبن إيه آي تدمج كودكس في تطبيق جات جي بي تي للهواتف الذكية