HyperAIHyperAI
منذ 9 أيام

GenTranslate: النماذج اللغوية الكبيرة هي مترجمون صوتيون آليون متعددو اللغات وقابلون للإعادة الإنشاء

Yuchen Hu, Chen Chen, Chao-Han Huck Yang, Ruizhe Li, Dong Zhang, Zhehuai Chen, Eng Siong Chng
GenTranslate: النماذج اللغوية الكبيرة هي مترجمون صوتيون آليون متعددو اللغات وقابلون للإعادة الإنشاء
الملخص

أحرزت النماذج اللغوية الكبيرة (LLMs) تقدماً حديثاً في تطوير الترجمة الصوتية متعددة اللغات والترجمة الآلية، وذلك بفضل تقليل أخطاء التمثيل ودمج المعرفة الخارجية. ومع ذلك، تستخدم كلا المهمتين تقنيات ترجمة شائعة مثل فك الترميز باستخدام بحث الشعاع (beam search) وتحديد الافتراض الأفضل (top-1) أثناء الاستنتاج. تعاني هذه التقنيات من صعوبة في استغلال المعلومات الغنية المتوفرة في مجموعة N-best المتنوعة من الافتراضات، مما يجعلها أقل كفاءة في المهام التي تتطلب توليد تسلسل ترجمة واحد عالي الجودة. في هذا البحث، نقترح نموذجاً جديداً توليدياً لمهام الترجمة يُسمى "GenTranslate"، الذي يعتمد على النماذج اللغوية الكبيرة لتوليد نتائج أفضل من خلال الاستفادة من الترجمات المتنوعة المتوفرة في قائمة N-best. وباستغلال المعرفة اللغوية الواسعة وقدرات الاستدلال القوية للنماذج اللغوية الكبيرة، يمكن للنموذج الجديد دمج المعلومات الغنية المتوفرة في المرشحات N-best لتوليد نتيجة ترجمة ذات جودة أعلى. علاوة على ذلك، ولدعم تدريب النماذج اللغوية الكبيرة بدقة (fine-tuning)، قمنا ببناء ونشر مجموعة بيانات تُسمى HypoTranslate، تحتوي على أكثر من 592 ألف زوج من الافتراضات والترجمات بـ 11 لغة. أظهرت التجارب على مجموعة متنوعة من معايير الترجمة الصوتية والآلية (مثل FLEURS، CoVoST-2، WMT) أن GenTranslate يتفوق بشكل كبير على النماذج الرائدة حالياً في المجال.