HyperAIHyperAI
منذ 18 أيام

نظام ترجمة الكلام من الطرف إلى الطرف دون اتصال لمؤتمر IWSLT 2020 باستخدام التعلم المتعدد الوسائط المُعدّل

{Sangha Kim, Sathish Reddy Indurthi, Mohd Abbas Zaidi, Nikhil Kumar Lakumarapu, Hou Jeung Han, Beomseok Lee}
نظام ترجمة الكلام من الطرف إلى الطرف دون اتصال لمؤتمر IWSLT 2020 باستخدام التعلم المتعدد الوسائط المُعدّل
الملخص

في هذه الورقة، نُقدّم النظام الذي تم تقديمه ل任務 الترجمة الصوتية غير المباشرة في IWSLT 2020. نستخدم بنية Transformer مدعومة بنهج التعلم التشاركي (meta-learning) لبناء نظام ترجمة صوتية إلى نص (ST) من النهاية إلى النهاية. يعالج نهج التعلم التشاركي مشكلة ندرة البيانات في مهمة الترجمة الصوتية من خلال الاستفادة من البيانات المتاحة من مهام التعرف التلقائي على الكلام (ASR) وترجمة الآلة (MT). وعند دمج نهج التعلم التشاركي مع تقنيات تكبير البيانات الاصطناعية، يُحسّن الأداء بشكل ملحوظ، ويحقق نماذجنا نقاط BLEU قدرها 24.58 و27.51 و27.61 على مجموعات اختبار IWSLT 2015، وMuST-C، وEuroparl-ST على التوالي.

نظام ترجمة الكلام من الطرف إلى الطرف دون اتصال لمؤتمر IWSLT 2020 باستخدام التعلم المتعدد الوسائط المُعدّل | أحدث الأوراق البحثية | HyperAI