الميزات اللغوية للإدخال تحسن الترجمة الآلية العصبية

ترجمة الآلة العصبية حققت مؤخرًا نتائجًا ملحوظة باستخدام القليل من المعلومات اللغوية الخارجية. في هذا البحث، نوضح أن قدرة تعلم النماذج العصبية لترجمة الآلة القوية لا تجعل الخصائص اللغوية زائدة عن الحاجة؛ بل يمكن دمجها بسهولة لتوفير تحسينات إضافية في الأداء. نعمم طبقة التضمين (embedding) للمشفر (encoder) في هندسة المشفر--المفكك المعتمد على الانتباه (attentional encoder--decoder) لدعم إدخال الخصائصbitrary عشوائية، بالإضافة إلى خاصية الكلمة الأساسية. نضيف الخصائص الصوتية، وعلامات الأجزاء النحوية، والعلامات الاعتمادية للتركيب كخصائص مدخلات لنظم ترجمة الآلة العصبية من الإنجليزية إلى الألمانية ومن الإنجليزية إلى الرومانية. في التجارب التي أجريت على مجموعات التدريب والاختبار لـ WMT16، وجدنا أن الخصائص اللغوية للمدخلات تحسن جودة النموذج وفقًا لثلاث مقاييس: الحيرة (perplexity)، BLEU، و CHRF3. هناك تنفيذ مفتوح المصدر لنظام ترجمة الآلة العصبية الخاص بنا متاح، كما هو الحال بالنسبة لملفات العينات والتوصيفات.请注意,这里的“arbitrary”在专业术语中通常翻译为“任意的”,但在上下文中为了更符合阿拉伯语表达习惯,这里翻译为“عشوائية”(随机的)。如果需要更准确的专业术语表达,可以将其翻译为“خواص تعسفية”(任意特征),并在括号中标注原文。