HyperAIHyperAI

Command Palette

Search for a command to run...

هل يمكن للذاكرة النشطة أن تحل محل الانتباه؟

Łukasz Kaiser; Samy Bengio

الملخص

في السنوات الأخيرة، تم استخدام عدة آليات لتركيز انتباه الشبكة العصبية على أجزاء محددة من إدخالها أو ذاكرتها بنجاح في نماذج التعلم العميق. لقد ساعد الانتباه في تحسين تصنيف الصور، وكتابة التعليقات على الصور، وتعرف الكلام، والنماذج التوليدية، والخوارزميات التعليمية، ولكنه كان له ربما أكبر الأثر على الترجمة الآلية العصبية.مؤخرًا، تم الحصول على تحسينات مشابهة باستخدام آليات بديلة لا تركز على جزء واحد فقط من الذاكرة ولكن تعمل على جميع أجزائها بشكل متوازي وبطريقة موحدة. نحن نطلق على هذه الآلية اسم "الذاكرة النشطة"، وقد تفوقت على الانتباه في المهام الخوارزمية ومعالجة الصور وفي النمذجة التوليدية.ومع ذلك، لم تتفوق الذاكرة النشطة حتى الآن على الانتباه في معظم مهام معالجة اللغة الطبيعية، وخاصةً في الترجمة الآلية. نقوم في هذا البحث بتحليل هذا القصور واقتراح نموذج موسّع للذاكرة النشطة يتطابق مع النماذج الحالية للانتباه في الترجمة الآلية العصبية ويؤدي بشكل أفضل مع الجمل الأطول. ندرس هذا النموذج ونوضح أسباب فشل النماذج السابقة للذاكرة النشطة. وأخيرًا، نناقش الحالات التي تكون فيها الذاكرة النشطة الأكثر فائدة والأماكن التي يمكن أن يكون فيها الانتباه الخيار الأفضل.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp