GLM 5.2 يتفوق على كلاود في اختبارات الأمن السيبراني
أجرى فريق أبحاث شركة Semgrep اختبارات تقنية موسعة لتقييم كفاءة نماذج الذكاء الاصطناعي في كشف ثغرات الإشارات المباشرة غير الآمنة (IDOR). استهدفت الدراسة بشكل خاص نموذج GLM-5.2 من شركة Zhipu AI الذي تم إطلاق أوزانه المفتوحة في 16 يونيو 2026. يعتمد هذا النموذج على بنية المختلطة من الخبراء، ويضم 750 مليار معامل مع 40 مليار معامل نشط فقط، مما يضمن كفاءة حسابية عالية مع دعم نافذة سياق تصل إلى مليون رمز، ويصدر تحت ترخيص MIT الملائم للتشغيل البيئي المحكوم. خُضعت مجموعة من النماذج، شملت GLM-5.2 وClaude Code، لنفس معايير الاختبار المعتمد من Semgrep، باستخدام مجموعة بيانات واحدة ونفس الموجهات النصية الأساسية. وتمت تجربة النماذج مفتوحة المصدر دون أي أطر عمل مساعدة أو أدوات استكشاف تلقائي، لمحاكاة بيئتها الافتراضية الخالصة. أسفرت النتائج عن تفوق واضح لنموذج GLM-5.2 بحصوله على معدل دقة F1 بنسبة 39 في المائة، متفوقاً على وكيل البرمجة المتطور Claude Code الذي تراوحت نتائجه بين 28 و32 في المائة، وذلك بتكلفة تشغيل تقارب 0.17 دولار لكل ثغرة مكتشفة، أي سدس تكلفة النماذج الرائدة التجارية. ورغم أن البنية المساعدة الخاصة بشركة Semgrep، التي تدمج نماذج GPT-5.5 وOpus-4.8 مع أدوات تحليل متخصص، حافظت على الصدارة بمعدل 53 إلى 61 في المائة، فإن التجربة تؤكد تحولاً استراتيجياً في سوق الذكاء الاصطناعي الأمني. يبرز النموذج GLM-5.2 كدليل على نضج الخيارات مفتوحة المصدر في معالجة المهام الأمنية المعقدة القائمة على المنطق والربط السياقي، مما يوفر بديلاً اقتصادياً وقابلاً للتشغيل المحلي لفرق الأمن التي تواجه قيوداً مؤسسية. ويؤكد المحللون أن هذا الاختبار، رغم تركيزه على مهمة واحدة، يمثل مؤشراً قوياً على اندماج البدائل مفتوحة المصدر في سلاسل أدوات الأمن السيبراني، مع التشديد على ضرورة المراقبة المستمرة لسلوك النماذج لضمان ثباتها وأمانها في بيئات الإنتاج.
