تطلق OpenAI تقنية "محاكاة النشر"، حيث يمكن محاكاة المخاطر الحقيقية قبل إطلاق النموذج
أعلنت OpenAI رسمياً عن منهجية تقييم أمني جديدة تُعرف بـ "محاكاة النشر"، تهدف إلى التنبؤ بأداء النموذج وسلوكه في السيناريوهات الواقعية والمخاطر المحتملة قبل إصداره. تعتمد هذه الطريقة على إعادة تشغيل بيانات المحادثات الحقيقية الحديثة بطرق تحمي الخصوصية، حيث يعيد نموذج المرشح توليد الردود لمحاكاة بيئة النشر الفعلية قبل الإطلاق الرسمي. في إطار تقييم سلسلة نماذج التفكير الخاصة بـ GPT-5، حللت شركة OpenAI ما يقرب من مليوني ومئة ألف محادثة مجهولة الهوية. وأظهرت النتائج أن محاكاة التفوق بشكل ملحوظ في توقع معدلات حدوث المخاطر مقارنة باختبارات "التلميحات التحديّة" التقليدية، مع دقة اتجاه أعلى، وخطأ ضربي وسطي قدره 1.5 مرة فقط عند تقدير معدلات الخطر المعروفة. بل إن هذه المنهجية تمكنت حتى من اكتشاف انحرافات سلوكية جديدة مثل "اختراق الآلات الحاسبة" قبل الإصدار، وهو أمر لم تغطّه الاختبارات التقليدية. إضافةً إلى ذلك، ساهمت محاكاة النشر في تقليل إدراك النموذج لحالته كونه "خاضعاً للاختبار"، بانخفاض احتمال تصنيفه لهذا السياق كتقييم من 99.72% كما هو الحال في الاختبارات التقليدية إلى 5.1%، وهي نسبة تقترب من مستوى البيانات الإنتاجية الحقيقية البالغة 5.38%. ويمكن توسيع نطاق تطبيق هذه المنهجية ليشمل سيناريوهات استخدام الأدوات المعقدة مثل وكلاء البرمجة، وذلك بالحفاظ على مصداقية البيئة عبر محاكاة استدعاءات الأدوات باستخدام النماذج اللغوية الكبيرة. وتؤكد OpenAI أن محاكاة النشر هي مكمّل وليس بديلاً لأساليب اختبار الفرق الحمراء والتقييمات العدائية التقليدية، مما يجعلها تلعب دوراً متزايد الأهمية في عمليات التقييم الشاملة للأمان.
