HyperAIHyperAI

Command Palette

Search for a command to run...

نموذج مُشفِّر قَطَعي للترجمة الآلية العصبية

Jonas Gehring Michael Auli David Grangier Yann N. Dauphin

الملخص

النهج السائد في الترجمة الآلية العصبية يعتمد على شبكات LSTM ثنائية الاتجاه لترميز الجملة المصدر. في هذا البحث، نقدم هندسة أسرع وأبسط تعتمد على سلسلة من طبقات التحويل (convolutional layers). هذا يسمح بترميز الجملة المصدر بالكامل بشكل متزامن مقارنة بشبكات التكرار (recurrent networks) التي تكون الحسابات فيها مقيدة بالاعتمادات الزمنية. على مهمة ترجمة الإنجليزية-الرومانية في WMT'16، حققنا دقة تنافسية مع أفضل النتائج المعاصرة، وتفوقنا على عدة نتائج تم نشرها مؤخرًا في مهمة ترجمة الإنجليزية-الألمانية في WMT'15. حصلت نماذجنا على دقة تقريبًا مماثلة لنموذج LSTM العميق جدًا في ترجمة الإنجليزية-الفرنسية في WMT'14. يسرع محول التشفير التقديمي الخاص بنا عملية فك الشفرة على وحدات المعالجة المركزية بمقدار أكثر من ضعفين عند نفس الدقة أو أعلى منها مقارنة بنموذج LSTM ثنائي الاتجاه القوي.请注意,这里“CPU”被直接保留为“CPU”,因为它是国际通用的技术缩写,在阿拉伯语中也常用这个英文缩写。其他术语如“convolutional layers”和“recurrent networks”则在首次出现时附上了英文注释,以确保信息的完整性。


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp