TranslateGemma: مجموعة جديدة من نماذج الترجمة المفتوحة
أعلن اليوم عن إطلاق "TranslateGemma"، سلسلة جديدة من نماذج الترجمة المفتوحة التي تُبنى على أساس نموذج Gemma 3، وتتوفر بثلاثة أحجام: 4 مليار، 12 مليار، و27 مليار معلمة. تمثل هذه المبادرة تقدماً كبيراً في مجال الترجمة المفتوحة، حيث تمكّن الأشخاص من التواصل بسلاسة عبر 55 لغة، بغض النظر عن موقعهم أو نوع الجهاز الذي يستخدمونه. تم بناء هذه النماذج عبر عملية استخلاص المعرفة من أقوى النماذج الكبيرة، لتحويلها إلى نماذج صغيرة لكنها عالية الأداء، دون التضحية بالجودة. ومن أبرز الإنجازات التقنية: نموذج TranslateGemma بحجم 12 مليار معلمة يتفوق في الأداء على النموذج القائم على Gemma 3 بحجم 27 مليار معلمة، وفقاً لقياسات معيار WMT24++ باستخدام أداة MetricX. هذا يعني أن المطورين يمكنهم تحقيق جودة ترجمة عالية بحجم نموذج أقل من نصف الحجم الأصلي، مما يعزز السرعة ويقلل التأخير، دون التفريط في الدقة. نموذج 4 مليار معلمة، بدوره، يُظهر أداءً يُضاهي النموذج الأكبر بحجم 12 مليار معلمة، ما يجعله خياراً مثالياً للتشغيل على الأجهزة المحمولة. تم اختبار TranslateGemma على مجموعة بيانات WMT24++ التي تشمل 55 لغة من مختلف العائلات اللغوية، بما في ذلك اللغات عالية، متوسطة، وقليلة الموارد. وقد أظهر النموذج انخفاضاً ملحوظاً في معدل الأخطاء مقارنة بالنموذج الأساسي، مع تحسين كبير في الجودة وفعالية الاستخدام. لتحقيق هذه الكثافة المعرفية، تم استخدام عملية تدريب مزدوجة مخصصة. في المرحلة الأولى، تم تدريب النماذج الأساسية على مجموعة بيانات متنوعة من النصوص المترجمة، تضم نصوصاً مترجمة بشرياً ونصوصاً مزيفة عالية الجودة تم إنشاؤها بواسطة نماذج Gemini المتقدمة. في المرحلة الثانية، تم تطبيق مرحلة تعلم التدعيم (RL) باستخدام مجموعة من نماذج المكافأة، منها أدوات متقدمة مثل MetricX-QE وAutoMQM، لتحسين دقة الترجمة وطبيعتها اللغوية. تم تدريب وتجريب TranslateGemma على 55 زوجاً من اللغات، مع ضمان جودة عالية في اللغات الرئيسية مثل الإسبانية، الفرنسية، الصينية، والهندية، بالإضافة إلى العديد من اللغات قليلة الموارد. كما تم تدريب النموذج على قرابة 500 زوج إضافي من اللغات، ليكون أساساً قوياً يمكن للباحثين تكييفه لتحسين الأداء في زوج معين من اللغات أو دعم اللغات قليلة الموارد. رغم عدم توفر قياسات تقييم رسمية لهذه المجموعة الموسعة، فقد تم إدراجها كاملاً في التقرير التقني لتشجيع البحث المجتمعي. تم الحفاظ على القدرات متعددة الوسائط القوية الخاصة بـ Gemma 3، حيث أظهرت النماذج تحسناً في ترجمة النصوص داخل الصور، حتى دون تدريب متعدد الوسائط خاص أثناء تطوير TranslateGemma. تُعد TranslateGemma نموذجاً مثالياً للتشغيل في بيئات متنوعة، من الخوادم إلى الأجهزة المحمولة، بفضل توازنها المثالي بين الأداء العالي والكفاءة الفائقة. وتم إطلاقها اليوم لتوفر للمطورين والباحثين أدوات قوية ومُعدّة للتكيف في مهام الترجمة المختلفة، نتطلع إلى رؤية كيف سيُستخدم هذا النموذج لتمهيد الطريق أمام التفاهم الثقافي وتحطيم حواجز اللغة.
