نظام الترجمة الآلية لجامعة سيدني لـ WMT19

يصف هذا البحث مشاركة جامعة سيدني في مهمة الترجمة المشتركة للأخبار لعام 2019 من قبل ورشة العمل للترجمة الآلية (WMT 2019). شاركنا في اتجاه الترجمة من الفنلندية إلى الإنجليزية وحصلنا على أفضل درجة BLEU (33.0) بين جميع المشاركين. يعتمد نظامنا على شبكات الـ Transformer ذات الانتباه الذاتي، والتي دمجنا فيها أحدث الاستراتيجيات الفعالة من الأبحاث الأكاديمية (مثل BPE، الترجمة العكسية، اختيار البيانات متعدد السمات، توسعة البيانات، الجمع النمطي الجشع، إعادة الترتيب، تركيبة أنظمة ConMBR، ومعالجة ما بعد الترجمة). بالإضافة إلى ذلك، نقترح طريقة جديدة لتوسعة البيانات تسمى "الترجمة الدائرية" (Cycle Translation) واستراتيجية خلط البيانات "كبيرة/صغيرة" بالتوازي لاستغلال المكتبة الصناعية بشكل كامل. تظهر التجارب الواسعة أن إضافة هذه التقنيات يمكن أن تحقق تحسينات مستمرة في درجات BLEU، وأن أفضل نتيجة تتفوق على النموذج الأساسي (نموذج جمع الـ Transformer المدرب باستخدام المكتبة المتوازية الأصلية) بحوالي 5.3 درجة BLEU، مما يحقق أداءً رائدًا في المجال.