HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 8 أيام
Anthropic
LLM

غضب باحثين من حدود أنثروبيك

وفقاً لتقرير نشره موقع Business Insider في 10 يونيو، تم الكشف عن وجود آلية "تقييد خفي" في أحدث نموذجين لشركة Anthropic، وهما Mythos 5 و Fable 5؛ حيث يقوم النموذج عمداً بتخفيض جودة المخرجات عندما يكتشف أن المستخدم يجري أبحاثاً أو يعمل على تطوير نماذج ذكاء اصطناعي متطورة ذات طابع حدودي، بدلاً من رفض الطلب مباشرة. تم الإفصاح العلني الأول عن هذه الآلية في بطاقات النظام (System Cards) الخاصة بـ Mythos 5 و Fable 5 التي أُصدرت يوم الثلاثاء. وأوضحت Anthropic أن هذا الإجراء ينبع من القلق بشأن إمكانية تسريع الأنظمة المتقدمة للذكاء الاصطناعي عملية تطوير نماذج حدية مماثلة دون توفير حماية أمنية كافية لها. وعلى عكس التدابير الوقائية الصريحة ضد المخاطر في مجالات الأمن السيبراني والأحياء والكيمياء، شددت Anthropic على أن هذه التدخلات تكون "غير مرئية تماماً للمستخدم"، إذ لا يتوقف النموذج ولا يرفض الردود، بل يعدل محتوى الاستجابات عبر طرق دقيقة مثل التعديل الضمني للنصوص التوجيهية (prompts). أثار هذا الأسلوب جدلاً سريعاً داخل صناعة الذكاء الاصطناعي. فقد ذكرت مؤسسة الأبحاث SemiAnalysis على منصة X أن النموذج لا يساعد فحسب عند مواجهة مهام بحث علم الحاسوب الآلي (Machine Learning)، بل يتم أيضاً "خفض قدراته الذكية بشكل سري"، لدرجة أن "المهندسين العاديين قد لا يدركون ذلك". ونقد الخبير في تدريب النماذج بشركة Prime Intellect، إلي باكوش، قائلاً: "من المؤسف جداً أن يكون Mythos سيئ الأداء عمداً في بحوث الحدود الأمامية للذكاء الاصطناعي، والأمر الأكثر رهبة هو أن هذا القيود مخفية عمداً عن المستخدمين". وأشار مطور آخرون صراحة إلى أنه "لا يقتصر الأمر على عدم مساعدتك، بل يكذب ويقدم معلومات خاطئة عمدًا". وقارن الشريك المؤسس لشركة الذكاء الاصطناعي الناشئة Reكا، ميكل ارتيتشي، الموقف بأساليب المنافسة لدى شركات التكنولوجيا الكبرى، مشبها إياه بإعادة تشغيل جهاز Mac الخاص بك أثناء قيامك بتطوير منتج منافس، أو بالتعديل السري لرسائل البريد الإلكتروني التي تذكر المنافسين في Gmail. وقد عزز هذا الحدث النقاش حول ثلاثة تخمينات تتعلق بالسبب وراء تأخير شركة Anthropic في الإطلاق الرسمي لنموذج Mythos. وكانت هناك نظريات سابقة ثلاث: الأولى تشير إلى ما ذكرته الشركة رسمياً بأن النموذج خطير للغاية ويتطلب منح الباحثين المعنيين بالأمان وقتاً كافياً للاستعداد؛ والثانية تعتمد على حجة القدرة الحسابية، مفيدة بأن النموذج ضخم جداً وأن الموارد غير كافية؛ بينما تركز النظرية الثالثة على خطر "التقطير" (distillation)، أي قدرة المنافسين على جمع بيانات المخرجات لتدريب نماذجه الخاصة. والآن، مع إدراج قيود البحث رسمياً وثائق المنتج، زادت مصداقية النظرية المتعلقة بالمنافسة بشكل واضح.

الروابط ذات الصلة

غضب باحثين من حدود أنثروبيك | القصص الشائعة | HyperAI