HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 2 أشهر

تقرير تقني عن Hunyuan-MT

Mao Zheng Zheng Li Bingxin Qu Mingyang Song Yang Du Mingrui Sun Di Wang

تقرير تقني عن Hunyuan-MT

الملخص

في هذا التقرير، نقدم نموذج الترجمة متعدد اللغات المفتوح المصدر Hunyuan-MT-7B، وهو أول نموذج من نوعه نطوره، ويُدعم الترجمة المزدوجة بين 33 لغة رئيسية، مع تركيز خاص على الترجمة بين اللغة الصينية الفصحى ولغات ولهجات الأقليات العرقية المختلفة. وبالإضافة إلى ذلك، لخدمة سيناريوهات الترجمة المتنوعة وتحسين أداء النموذج أثناء الاختبار، نقدّم نموذج Hunyuan-MT-Chimera-7B، الذي يُلهم بأسلوب التفكير البطيء (Slow Thinking). ويُدمج هذا النموذج عدة مخرجات تم إنتاجها بواسطة نموذج Hunyuan-MT-7B تحت إعدادات متنوعة للبارامترات، مما يُحقق أداءً أفضل من النماذج التقليدية التي تعتمد على نموذج التفكير المتسلسل (Chain-of-Thought - CoT).وتم تطوير نماذجنا وفقًا لعملية تدريب شاملة تم تصميمها خصيصًا للترجمة متعددة اللغات، وتبدأ بمرحلة التدريب الأولي العام والمرتبط بالترجمة (Pre-training) لبناء القدرات الأساسية، ثم تنتقل إلى التدريب المُراقب المُخصص (Supervised Fine-Tuning - SFT) لتكيف النموذج مع المهام المحددة، وتنتهي بمرحلة التوافقيات المتقدمة من خلال التعلم المعزز (Reinforcement Learning - RL) والتعلم المعزز من الضعيف إلى القوي (Weak-to-Strong RL).ومن خلال تجارب مكثفة، نُظهر أن كلا النموذجين Hunyuan-MT-7B وHunyuan-MT-Chimera-7B يتفوقان بشكل كبير على جميع النماذج المخصصة للترجمة ذات الحجم المماثل للبارامترات، وكذلك على معظم النماذج الرائدة (SOTA) من النماذج الكبيرة، خاصةً في مهام الترجمة بين اللغة الصينية الفصحى ولغات ولهجات الأقليات العرقية. وفي مهمة WMT2025 المشتركة (الترجمة الآلية العامة)، حقق نموذجنا أداءً رائدًا على مستوى العالم، واحتل المركز الأول في 30 من أصل 31 زوجًا لغويًا. ويُبرز هذا الأداء القوة والمتانة التي يتمتع بها نموذجنا عبر طيف لغوي متنوع، يشمل اللغات ذات الموارد الكبيرة مثل الصينية، والإنجليزية، واليابانية، فضلًا عن اللغات ذات الموارد المحدودة مثل التشيكية، والماراثية، والإستونية، والإيسلندية.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
تقرير تقني عن Hunyuan-MT | الأوراق البحثية | HyperAI