HyperAI

مترجم: تطوير الترجمة الثنائية بين العربية والإنجليزية باستخدام نموذج لغوي صغير

Hennara, Khalil ; Hreden, Muhammad ; Hamed, Mohamed Motaism ; Aldallal, Zeina ; Chrouf, Sara ; AlModhayan, Safwan
تاريخ النشر: 5/27/2025
مترجم: تطوير الترجمة الثنائية بين العربية والإنجليزية باستخدام نموذج لغوي صغير
الملخص

نقدم "مترجم"، وهو نموذج لغوي مدمج ومع ذلك قوي، مصمم للترجمة الثنائية من العربية إلى الإنجليزية ومن الإنجليزية إلى العربية. بينما أظهرت النماذج اللغوية الكبيرة تقدماً ملحوظاً في مهام معالجة اللغة الطبيعية، بما في ذلك الترجمة الآلية، فإن النماذج الأصغر لديها فوائد خاصة فيما يتعلق بالتكلفة الحاسوبية والمتطلبات التدريب. استنادًا إلى هذه الرؤية، طورنا "مترجم" بناءً على نموذج "كوين-1.5 ب" (Kuwain-1.5B)، وهو نموذج لغوي مخصص لكل من العربية والإنجليزية. رغم حجمه المتواضع، يتفوق "مترجم" على نماذج أكبر بكثير في عدة مقاييس معترف بها، وذلك بفضل منهجية تدريب ثنائية مرحلتين تم تحسينها وقاعدة بيانات تدريب عالية الجودة ومختارة بعناية.تظهر النتائج التجريبية أن "مترجم" ينافس النماذج التي تكون أكبر بمقدار 20 مرة بينما يقلل بشكل كبير من التكاليف الحاسوبية ومتطلبات التدريب. كما نقدم "ترجمة-25"، وهو مقاييس جديد صمم للتغلب على القيود الموجودة في مجموعات البيانات المعيارية الحالية للترجمة بين العربية والإنجليزية، مثل ضيق المجالات، طول الجمل القصير، وتفضيل المصادر الإنجليزية. يتكون "ترجمة-25" من 5,000 زوج جمل تم مراجعتها من قبل خبراء ويغطي مجموعة واسعة من المجالات، مما يقدم إطار تقييم أكثر شمولًا وتوازنًا.يُذكر أن "مترجم" حقق أداءً رائدًا في مهمة الترجمة من الإنجليزية إلى العربية ضمن مقاييس "ترجمة-25"، حيث تفوق حتى على النماذج الأكبر والأكثر حصرية مثل GPT-4o mini (مع إشارة إلى الأصل). لقد أطلقنا "ترجمة-25" للعامة لدعم البحث المستقبلي وتعزيز تقييم أنظمة الترجمة بين العربية والإنجليزية.