HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 20 أيام
LLM
Transformer

انهيار انتباه النماذج الكبيرة

كشفت دراسة حديثة أجراها باحثون في قسم علم النفس بكلية كوينز بجامعة مدينة نيويورك عن قصور جوهري في آلية الانتباه داخل النماذج اللغوية الكبيرة، حيث تفشل هذه النماذج في حل التعارضات المعرفية عند زيادة طول المتتابعات النصية، مما يسلط الضوء على حدود معمارية المترجم الحالية في محاكاة الضبط التنفيذي البشري. اعتمدت التجربة على مهمة سترروب الكلاسيكية، المصممة لقياس قدرة النظام على كبت الاستجابات التلقائية لصالح المهام المعقدة. خضع عدد من النماذج الرائدة، بينها GPT-4o وClaude 3.5 Sonnet، بالإضافة إلى إصدارات أحدث مثل GPT-5 وClaude Opus 4.1 وGemini 2.5 Pro، للاختبار عبر التعرف على ألوان الحبر لكلمات تشير إلى ألوان مغايرة. تم تصميم المتغيرات لقياس الأداء مع زيادة عدد الكلمات في القوائم من خمسة إلى أربعين كلمة، بهدف رصد قدرة النماذج على الحفاظ على التوجيه المستقر تحت حمولة معرفية متزايدة. أظهرت البيانات هبوطاً حاداً في الدقة عند مواجهة التعارض بين دلالة الكلمة ولون حبرها مع إطالة المتسلسلة. بينما سجلت النماذج دقة عالية في القوائم القصيرة، انخفضت بشكل ملحوظ عند الوصول إلى الأربعين كلمة، مع قرب الدقة من الصفر في الظروف المختلطة. أكدت الاختبارات الضابطة أن هذا التراجع ليس ناتجاً عن عجز في الذاكرة أو معالجة الوسائط المتعددة، بل يمثل فشلاً نوعياً في كبت التداخل وتوزيع الموارد الانتباهية عند تضارب الإشارات. كما لاحظ الباحثون غياب آلية التكيف الذاتي، حيث لم تستطع النماذج تحسين أدائها في التعارضات المتتالية رغم استيعابها الواعي لقواعد المهمة، بل لجأت بعضها إلى كتابة أكواد برمجية كحل بديل. يعزو الفريق البحثي هذا السلوك إلى الطبيعة الإحصائية البحتة لآليات الانتباه الذاتي في معمارية المترجم، التي تفتقر إلى حلقة التغذية الراجعة التصاعدية المسؤولة عن تعزيز التحكم التنفيذي في الوقت الفعلي. ويشير التقرير المنشور في مجلة PNAS Nexus إلى أن تراكم البيانات والمعاملات لا يضمن استقرار الأداء في المهام طويلة المدى المعقدة. ويدعو الخبراء إلى تطوير معماريات ذكاء اصطناعي مستوحاة من البيولوجيا العصبية، تدمج بوابات انتباه انتقائية وآليات ضبط تنفيذي لمحاكاة الشبكات الدماغية المسؤولة عن التركيز المستهدف. وتسهم هذه الدراسة في ترسيخ اتجاهين استراتيجيين: اعتماد الاختبارات الإدراكية البشرية كأدوات تشخيصية دقيقة لقياد حدود الذكاء الاصطناعي، والانتقال من النماذج التنبؤية الخالصة نحو أنظمة هجينة تدمج التحليل الإحصائي مع آليات التحكم الديناميكي، وهو مسار حاسم نحو الذكاء العام الاصطناعي.

الروابط ذات الصلة

انهيار انتباه النماذج الكبيرة | القصص الشائعة | HyperAI