HyperAIHyperAI

Command Palette

Search for a command to run...

الاهتمام المغلق

التاريخ

منذ 2 أشهر

المؤسسة

مجموعة علي بابا
معهد ماساتشوستس للتكنولوجيا
جامعة ستانفورد
جامعة إدنبرة

رابط الورقة البحثية

1b7whO4SfY

في مايو 2025، اقترح فريق علي بابا تونغي تشيانوين فكرة "الانتباه المُقيّد" بالتعاون مع فرق بحثية من جامعة إدنبرة وجامعة ستانفورد وجامعات أخرى. نُشرت نتائج البحث ذات الصلة في ورقة بحثية بعنوان "الاهتمام المُقيّد لنماذج اللغة الكبيرة: اللاخطية، والندرة، والخالية من مُشتتات الانتباه"، حصلت على جائزة أفضل ورقة بحثية في NeurIPS 2025.

أجرى فريق البحث دراسة منهجية لسلسلة من متغيرات الانتباه المعززة بالبوابات من خلال تجارب واسعة النطاق (غطت 30 متغيرًا من نماذج MoE بكثافة 15B و1.7B، مدربة على رموز 3.5T). وخلصت الدراسة إلى أن تطبيق بوابة سيجمويدية محددة الرأس بعد معالجة الانتباه النقطي المتدرج (SDPA) يمكن أن يُحسّن أداء النموذج باستمرار. يُبرز هذا الإنجاز تأثير آليات البوابة على أداء النموذج وسلوكه في طبقات الانتباه القياسية، كاشفًا عن قدرتها على إدخال اللاخطية، والتشتت، والتخلص من فخاخ الانتباه من خلال تقييم متغيرات البوابة. تُعمّق هذه النتائج فهم القطاع لآليات الانتباه المعزز.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp