HyperAIHyperAI

Command Palette

Search for a command to run...

الترجمة العصبية الآلية في الزمن الخطي

Nal Kalchbrenner Lasse Espeholt Karen Simonyan Aäron van den Oord Alex Graves Koray Kavukcuoglu

الملخص

نقدم شبكة عصبية جديدة لمعالجة التسلسلات. يتألف ByteNet من شبكتين عصبيتين اثنتين ذاتيتي البعد الواحد، إحداهما لترميز التسلسل المصدر والثانية لفك ترميز التسلسل الهدف. يتم ربط الجزأين من الشبكة عن طريق تجميع فك الترميز فوق الترميز مع الحفاظ على دقة الوقت للتسلسلات. للتعامل مع الاختلاف في أطوال التسلسلات المصدر والهدف، نقدم آلية فعالة تسمح بتوسيع فك الترميز بشكل ديناميكي عبر تمثيل الترميز. يستخدم ByteNet التقنية الموسعة (dilation) في طبقات التجعيد (convolutional layers) لزيادة مجال الاستقبال (receptive field). تتسم الشبكة الناتجة بخاصيتين أساسيتين: تعمل في وقت خطي بالنسبة لأطوال التسلسلات وتتجنب الحاجة إلى حفظ مفرط. حقق فك ترميز ByteNet أفضل الأداء على مستوى الحروف في نمذجة اللغة وتفوق على أفضل النتائج السابقة التي تم الحصول عليها باستخدام الشبكات المتكررة (recurrent networks). كما حقق ByteNet أفضل الأداء في ترجمة آلة على مستوى الحرف للترجمة الإنجليزية-الألمانية في مهمة WMT للترجمة، متجاوزًا نماذج الترجمة العصبية المماثلة التي تعتمد على الشبكات المتكررة مع تجميع الانتباه (attentional pooling) والتي تعمل في وقت مربع. وجدنا أن الهيكل الضمني للمواءمة (latent alignment structure) الموجود في التمثيلات يعكس المواءمة المتوقعة بين الرموز (tokens).


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp