HyperAIHyperAI

Command Palette

Search for a command to run...

جوجل تطلق Granite 4.0 1B للصوت متعدد اللغات

أطلقت شركة آي بي إم (IBM) نموذج Granite 4.0 1B Speech، وهو أحدث إصدار في مجموعتها الخاصة بمعالجة اللغة الصوتية، ومصمم خصيصًا للتطبيقات المؤسسية التي تعمل على الأجهزة ذات الموارد المحدودة. يتميز هذا النموذج بصغر حجمه، حيث يمتلك نصف عدد معاملات سلفه المسمى granite-speech-3.3-2b، لكنه يقدم دقة أعلى في نقل الكلام باللغة الإنجليزية وسرعة معالجة متزايدة بفضل تقنية التنبؤ المسبق. يدعم النموذج الآن التعرف على الكلام الآلي والترجمة ثنائية الاتجاه لست لغات هي: الإنجليزية، الفرنسية، الألمانية، الإسبانية، البرتغالية، واليابانية. وتشمل التحسينات الجديدة في هذا الإصدار دعم اللغة اليابانية للتعرف على الكلام، بالإضافة إلى ميزة توجيه القائمة لتسهيل التعرف على الأسماء والأحرف المختصرة، وهي قدرات طلبها المجتمع التقني بشكل متكرر. حقق النموذج المرتبة الأولى في leaderboard المنبع OpenASR، مما يعكس أدائه القوي بين أنظمة التعرف على الكلام المفتوحة المصدر. ورغم صغر حجمه، فإن النتائج التي حققها على المقاييس القياسية لخطأ الكلمات (WER)، التي تقارن فيها دقة النسخ حيث تشير الدرجات الأقل إلى أداء أفضل، تنافسية جدًا وتتفوق على نماذج أكبر بكثير في استخدام المعاملات. يعمل النموذج بموجب رخصة Apache 2.0 ويتكامل بشكل أصلي مع أدوات مثل transformers وvLLM، وقد أظهر تقييمه أداءً مساويًا أو أفضل من نماذج أكبر حجمًا في مهام التعرف على الكلام المترجمة ومتعددة اللغات. تتوفر تفاصيل كاملة حول بنية النموذج وبيانات التدريب أمثلة الاستخدام في بطاقة النموذج الرسمية، وتوصي آي بي إم باستخدامه مع Granite Guardian في بيئات الإنتاج التي تتطلب كشفًا إضافيًا للمخاطر، ودعت المطورين لتجربة النموذج وتقديم ملاحظاتهم.

الروابط ذات الصلة

جوجل تطلق Granite 4.0 1B للصوت متعدد اللغات | القصص الشائعة | HyperAI