اختطاف سلسلة الأفكار
طُرح مفهوم "اختطاف سلسلة الأفكار" (CoT Hijacking) في أكتوبر 2025 من قِبل الباحث المستقل جيانلي تشاو وفريق بحثي من جامعة ستانفورد ومؤسسات أخرى. ونُشرت نتائج البحث ذات الصلة في ورقة بحثية. اختطاف سلسلة الأفكار .
يُعدّ اختراق سلسلة العقل هجومًا لكسر حماية نماذج الاستدلال، حيث تُضاف عملية استدلال غير ضارة قبل التعليمات الضارة. يُقلّل هذا الهجوم باستمرار من معدل الرفض ويحقق معدلات نجاح فائقة. على منصة HarmBench، حقق اختراق سلسلة العقل معدلات نجاح هجوم (ASR) بلغت 99%، و94%، و100%، و94% على أجهزة Gemini 2.5 Pro، وGPT o4 mini، وGrok 3 mini، وClaude 4 Sonnet على التوالي، متجاوزًا بذلك بكثير أساليب كسر الحماية السابقة التي استهدفت نماذج الاستدلال المنطقي (LRMs).
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.