HyperAIHyperAI
منذ 2 أشهر

نموذج مُشفِّر قَطَعي للترجمة الآلية العصبية

Jonas Gehring; Michael Auli; David Grangier; Yann N. Dauphin
نموذج مُشفِّر قَطَعي للترجمة الآلية العصبية
الملخص

النهج السائد في الترجمة الآلية العصبية يعتمد على شبكات LSTM ثنائية الاتجاه لترميز الجملة المصدر. في هذا البحث، نقدم هندسة أسرع وأبسط تعتمد على سلسلة من طبقات التحويل (convolutional layers). هذا يسمح بترميز الجملة المصدر بالكامل بشكل متزامن مقارنة بشبكات التكرار (recurrent networks) التي تكون الحسابات فيها مقيدة بالاعتمادات الزمنية. على مهمة ترجمة الإنجليزية-الرومانية في WMT'16، حققنا دقة تنافسية مع أفضل النتائج المعاصرة، وتفوقنا على عدة نتائج تم نشرها مؤخرًا في مهمة ترجمة الإنجليزية-الألمانية في WMT'15. حصلت نماذجنا على دقة تقريبًا مماثلة لنموذج LSTM العميق جدًا في ترجمة الإنجليزية-الفرنسية في WMT'14. يسرع محول التشفير التقديمي الخاص بنا عملية فك الشفرة على وحدات المعالجة المركزية بمقدار أكثر من ضعفين عند نفس الدقة أو أعلى منها مقارنة بنموذج LSTM ثنائي الاتجاه القوي.请注意,这里“CPU”被直接保留为“CPU”,因为它是国际通用的技术缩写,在阿拉伯语中也常用这个英文缩写。其他术语如“convolutional layers”和“recurrent networks”则在首次出现时附上了英文注释,以确保信息的完整性。

نموذج مُشفِّر قَطَعي للترجمة الآلية العصبية | أحدث الأوراق البحثية | HyperAI