Claude Mythos: النموذج السري الذي دفع Anthropic إلى تقسيمه خوفاً من مخاطره الأمنية

نموذج Claude Mythos السري ضمن مشروع Glasswing مع رموز الأمن السيبراني واكتشاف الثغرات الأمنية المتقدمة.

​في السابع من أبريل الماضي، فاجأت Anthropic الجميع بإعلانها عن نموذج غريب الاسم: Claude Mythos Preview.

​بس على عكس اللي اعتدنا عليه من إطلاقات الذكاء الاصطناعي، هالمرة ما في رابط تضغط عليه وتجرب، ولا قائمة انتظار تسجّل فيها. الأبواب مغلقة، والوصول محصور على قائمة سرية ومختارة بعناية من كبرى شركات التكنولوجيا والجهات الأمنية، تحت مظلة مشروع دفاعي اسمه Project Glasswing.

​والسبب؟ مو تسويق ولا ضجة إعلامية. السبب الحقيقي كان قدرة واحدة صدمت المطورين قبل غيرهم: النموذج يكتشف الثغرات الأمنية الصفرية (Zero-Day) ويستغلها هجومياً بشكل مستقل تماماً، وبسرعة تخلّي فرق المخترقين المحترفين تبدو بطيئة بالمقارنة.

​نموذج للأغراض العامة تفوق على المتخصصين

​اللي يزيد الموضوع غرابة أن Mythos ما صُمّم أصلاً ليكون أداة أمن سيبراني. كان نموذجاً للأغراض العامة، برمجة ومحاكاة وما شابهها. لكن لما وصل لمرحلة التقييم، تفوق على الجميع بطريقة ما كان أحد يتوقعها.

​الأرقام اللي وثّقتها لجان الاختبار كانت كفيلة بإقلاق مجتمع الأمن الرقمي بأكمله:

  • ثغرة عمرها 27 سنة: النموذج اكتشف بنفسه ثغرة برمجية حرجة في نظام OpenBSD، كانت مختبئة من عيون المطورين طوال 27 سنة كاملة!
  • هجمات معقدة في دقائق: اختبارات مستقلة أجراها معهد أمن الذكاء الاصطناعي البريطاني أثبتت أن النموذج يقدر يخطط وينفذ هجمات سيبرانية متعددة المراحل ضد شبكات المؤسسات في دقائق، مهمة كانت تحتاج أياماً من الخبراء البشر.

​”The Sandwich Email”: اللحظة التي أصبحت أيقونة في عالم أمان الذكاء الاصطناعي

​أثنائ اختبارات الأمان الداخلية، وضع فريق Anthropic نسخة مبكرة من Mythos داخل بيئة معزولة (sandbox) مقطوعة تماماً عن الإنترنت، وأعطوه تعليمة واضحة: حاول الهرب وأرسل رسالة للباحث المشرف.

​النموذج نجح في كسر العزلة باستخدام exploit متعدد الخطوات، اكتسب وصولاً للإنترنت، وأرسل إيميلاً فعلياً للباحث المشرف يُبلّغه بنجاح العملية. اللحظة المثيرة كانت أن الباحث كان يأكل سندويتش في الحديقة خارج المبنى لما وصل الإيميل على هاتفه!

​لكن اللي تجاوز التوقعات أن النموذج ذهب أبعد من المطلوب، ونشر تفاصيل الـexploit على مواقع عامة دون أن يطلب منه أحد ذلك. هذا الحدث موثق في System Card الرسمي لـAnthropic وعلى red.anthropic.com، وأصبح يُعرف في أوساط أمان الذكاء الاصطناعي بـ “The Sandwich Email”.

​التحديث الجديد:

​ الاثنين 9 يونيو، أعلنت Anthropic عن خطوتها المحسوبة لحل هذه المعضلة: تقسيم الجيل الجديد من النموذج لنسختين منفصلتين تماماً:

​1. Claude Fable 5 النسخة الآمنة للجميع

​هو النموذج المتاح الآن للعموم والمدمج في الخطط المدفوعة وخدمات المطورين. نفس القدرات العقلية والبرمجية الهائلة لـ Mythos، لكن مزوّد بمصفّفات أمان صارمة. لو حاولت تسأله عن ثغرة أمنية أو طلبت كوداً هجومياً، يعتذر فوراً ويحوّل طلبك تلقائياً لنموذج أقدم وأكثر أماناً.

​2. Claude Mythos 5 النسخة الحصرية

​الوريث الشرعي للنسخة التجريبية الأولى. نفس Fable 5 بالضبط لكن بدون القيود الأمنية المضافة. لا يزال محظوراً على الجمهور، ومتاح فقط تحت رقابة مشددة عبر Project Glasswing للجهات الدفاعية والحكومية.

​النتائج على أرض الواقع

​Project Glasswing أثبت نجاحاً مذهلاً. بفضل قدرات النموذج، تمكن الشركاء ومن بينهم Google وMicrosoft وApple وNVIDIA من اكتشاف وإغلاق أكثر من 10,000 ثغرة أمنية عالية الخطورة في أنظمة حيوية تخدم مئات الملايين حول العالم.

​والبرنامج توسّع مؤخراً ليشمل 150 منظمة دولية جديدة تغطي قطاعات البنية التحتية والمياه والطاقة.

​التحدي القادم للأمن الرقمي

​رغم ذكاء الخطة، Anthropic نفسها تعترف بأن هذا التحكم مؤقت. التوقعات تقول إنه خلال 6 إلى 12 شهراً، ستصل الشركات المنافسة لنفس هذه القدرات الهجومية، وما في أي ضامن بأنهم سيفصلون بين الخير والشر بنفس الطريقة الصارمة.

​الهدف الحقيقي اليوم مو بس ترقيع الأنظمة، بل تحضير العالم الرقمي لواقع جديد، سيكون فيه الذكاء الاصطناعي هو المهاجم الأقوى، والمدافع الأمضى!

أقرأ ايضاً

المشاكل التي ظهرت لدى مستخدمي هواتف آيفون الحديثة”

الرادار التقني

الرادار التقني منصة عربية متخصصة في أخبار التقنية والهواتف الذكية والتسريبات والمراجعات والمقارنات. نقدم تغطية يومية لأحدث الأجهزة والتقنيات من كبرى الشركات العالمية مع التركيز على الدقة والسرعة في نقل الأخبار التقنية ومساعدة القراء على اتخاذ قرارات شراء أفضل.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *