Command Palette
Search for a command to run...
MiMo-Audio-7B-Instruct: نموذج صوتي شامل مفتوح المصدر من Xiaomi
1. مقدمة البرنامج التعليمي

MiMo-Audio هو نموذج كلام متكامل أصدرته شركة Xiaomi في سبتمبر 2025. وقد تم توسيع بيانات ما قبل التدريب الخاصة به إلى أكثر من 100 مليون ساعة، ولاحظ الباحثون أنه يُظهر قدرات تعلم قليلة اللقطات عبر مجموعة متنوعة من المهام الصوتية. وقد قام الفريق بتقييم هذه القدرات بشكل منهجي ووجد أن MiMo-Audio-7B-Base حقق نتائج متطورة (SOTA) على معايير نموذج مفتوح المصدر لذكاء الكلام وفهم الصوت. بالإضافة إلى المقاييس القياسية، يُعمم النموذج أيضًا على المهام غير المشمولة في بيانات التدريب، مثل تحويل الصوت ونقل الأسلوب وتحرير الكلام. علاوة على ذلك، يمتلك MiMo-Audio-7B-Base قدرات قوية لاستمرار الكلام، مما يتيح إنشاء برامج حوارية وتلاوات وبث مباشر ومناظرات واقعية للغاية. في مرحلة ما بعد التدريب، جمع الباحثون مجموعة متنوعة من مجموعات التعليمات الدقيقة وأدخلوا آلية تفكير في فهم الصوت وتوليده. حقق برنامج MiMo-Audio-7B-Instruct نتائج متقدمة في مجال المصادر المفتوحة في معايير فهم الصوت، ومعايير الحوار المنطوق، وتوليف الكلام القائم على التعليمات (instruct-TTS)، مقتربًا من نماذج المصادر المغلقة أو متفوقًا عليها في بعض السيناريوهات. نتائج البحث ذات الصلة هي:تقرير فني صوتي من MiMo".
يستخدم هذا البرنامج التعليمي بطاقة رسوميات RTX 5090 واحدة كمورد حوسبة.
2. أمثلة على التأثيرات
1. 🔊 فهم الصوت

2. 🎵 توليد الصوت وتحويل النص إلى كلام

٣. 🎤 الحوار الشفهي

4. 💬 حوار S2T

5. 📝 حوار من نص إلى نص

3. خطوات التشغيل
1. ابدأ تشغيل الحاوية

2. تهيئة معلمات الوزن
إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 2-3 دقائق وتحديث الصفحة.
عند استخدام متصفح Safari، قد لا يتم تشغيل الصوت مباشرة ويجب تنزيله قبل التشغيل.

3. فهم الصوت

4. توليد الصوت

5. المحادثة الصوتية

6. محادثة صوتية إلى نصية

7. محادثة نصية إلى نصية

معلومات الاستشهاد
@misc{coreteam2025mimoaudio,
title={MiMo-Audio: Audio Language Models are Few-Shot Learners},
author={LLM-Core-Team Xiaomi},
year={2025},
url={https://github.com/XiaomiMiMo/MiMo-Audio},
}
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.