HyperAIHyperAI

Command Palette

Search for a command to run...

GenTranslate: النماذج اللغوية الكبيرة هي مترجمون صوتيون آليون متعددو اللغات وقابلون للإعادة الإنشاء

Yuchen Hu Chen Chen Chao-Han Huck Yang Ruizhe Li Dong Zhang Zhehuai Chen Eng Siong Chng

الملخص

أحرزت النماذج اللغوية الكبيرة (LLMs) تقدماً حديثاً في تطوير الترجمة الصوتية متعددة اللغات والترجمة الآلية، وذلك بفضل تقليل أخطاء التمثيل ودمج المعرفة الخارجية. ومع ذلك، تستخدم كلا المهمتين تقنيات ترجمة شائعة مثل فك الترميز باستخدام بحث الشعاع (beam search) وتحديد الافتراض الأفضل (top-1) أثناء الاستنتاج. تعاني هذه التقنيات من صعوبة في استغلال المعلومات الغنية المتوفرة في مجموعة N-best المتنوعة من الافتراضات، مما يجعلها أقل كفاءة في المهام التي تتطلب توليد تسلسل ترجمة واحد عالي الجودة. في هذا البحث، نقترح نموذجاً جديداً توليدياً لمهام الترجمة يُسمى "GenTranslate"، الذي يعتمد على النماذج اللغوية الكبيرة لتوليد نتائج أفضل من خلال الاستفادة من الترجمات المتنوعة المتوفرة في قائمة N-best. وباستغلال المعرفة اللغوية الواسعة وقدرات الاستدلال القوية للنماذج اللغوية الكبيرة، يمكن للنموذج الجديد دمج المعلومات الغنية المتوفرة في المرشحات N-best لتوليد نتيجة ترجمة ذات جودة أعلى. علاوة على ذلك، ولدعم تدريب النماذج اللغوية الكبيرة بدقة (fine-tuning)، قمنا ببناء ونشر مجموعة بيانات تُسمى HypoTranslate، تحتوي على أكثر من 592 ألف زوج من الافتراضات والترجمات بـ 11 لغة. أظهرت التجارب على مجموعة متنوعة من معايير الترجمة الصوتية والآلية (مثل FLEURS، CoVoST-2، WMT) أن GenTranslate يتفوق بشكل كبير على النماذج الرائدة حالياً في المجال.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp