HyperAIHyperAI
منذ 2 أشهر

الوحدات المتكررة البسيطة للترابط عالي التوازي

Tao Lei; Yu Zhang; Sida I. Wang; Hui Dai; Yoav Artzi
الوحدات المتكررة البسيطة للترابط عالي التوازي
الملخص

تُعاني المعماريات العصبية التكرارية الشائعة من صعوبة في التوسع بسبب الصعوبات الجذرية في توازي حسابات الحالة الخاصة بها. في هذا البحث، نقترح وحدة التكرار البسيطة (SRU)، وهي وحدة تكرارية خفيفة توازن بين قدرة النموذج والقابلية للتوسع. تم تصميم الوحدة البسيطة للتكرار لتوفير تكرارًا تعريفيًا، تمكين التنفيذ بالتوازي بشكل كبير، وتأتي مع تهيئة دقيقة لتسهيل تدريب النماذج العميقة. نثبت فعالية الوحدة البسيطة للتكرار في مهام متعددة للمعالجة اللغوية الطبيعية (NLP). تحقق الوحدة البسيطة للتكرار سرعةً أكبر بـ 5-9 أضعاف عن LSTM المحسنة بواسطة cuDNN على مجموعات البيانات الخاصة بالتصنيف وإجابة الأسئلة، وتوفر نتائجًا أفضل من LSTM والنماذج الإقحامية. كما حصلنا على تحسن متوسط بمقدار 0.7 نقطة BLEU على نموذج Transformer في الترجمة بإدخال الوحدة البسيطة للتكرار إلى المعمارية.

الوحدات المتكررة البسيطة للترابط عالي التوازي | أحدث الأوراق البحثية | HyperAI