HyperAI

نموذج توضيحي لفهم الكلام Voxtral-Small-24B-2507

1. مقدمة البرنامج التعليمي

Voxtral هو نموذج صوتي متقدم أطلقته Mistral AI في يوليو 2025. بفضل قدرته الممتازة على نسخ الكلام وفهمه العميق، يُعزز Voxtral استخدام الصوت كوسيلة طبيعية للتفاعل بين الإنسان والحاسوب. يتوفر Voxtral بإصدارين 24B و3B، مناسبين للاستخدام على نطاق الإنتاج والنشر المحلي على التوالي. يدعم Voxtral لغات متعددة، وسياق نص طويل، ووظائف أسئلة وأجوبة مدمجة، ووظائف تلخيص، ويمكنه تشغيل استدعاءات وظائف الواجهة الخلفية مباشرةً. يتفوق أداء Voxtral على نماذج المصدر المفتوح الحالية وواجهات برمجة التطبيقات الخاصة في العديد من المعايير، مع انخفاض تكلفته واستخدامه على نطاق واسع في سيناريوهات مختلفة، مما يُسهم في تعميم التفاعل الصوتي.

المميزات الرئيسية:

  • معالجة سياق النصوص الطويلة: تدعم ما يصل إلى 30 دقيقة من النسخ الصوتي و40 دقيقة من فهم الصوت، ويمكنها التعامل مع المحتوى الطويل المعقد.
  • الأسئلة والأجوبة المدمجة والتلخيص: اطرح الأسئلة مباشرة حول المحتوى الصوتي أو أنشئ ملخصات منظمة دون الحاجة إلى نماذج التعرف الصوتي واللغة الإضافية.
  • دعم متعدد اللغات: الكشف التلقائي عن اللغة، ودعم العديد من اللغات الشائعة (مثل الإنجليزية والإسبانية والفرنسية والبرتغالية والهندية والألمانية، وما إلى ذلك) لتلبية احتياجات المستخدمين العالميين.
  • مكالمات الوظائف التي يتم تشغيلها صوتيًا: قم بتشغيل وظائف الواجهة الخلفية أو سير العمل أو مكالمات واجهة برمجة التطبيقات بشكل مباشر استنادًا إلى نية صوت المستخدم دون الحاجة إلى خطوات تحليل وسيطة.
  • قدرة فهم النص: يتم الاحتفاظ بقدرة فهم النص في Mistral Small 3.1، ودعم إدخال النص ومعالجته.
  • أداء نسخ محسّن: يوفر نقاط نهاية نسخ محسّنة للغاية وفعالة من حيث التكلفة ومناسبة للتطبيقات واسعة النطاق.

تعتمد موارد الحوسبة في هذا البرنامج التعليمي على بطاقة RTX A6000 ثنائية البطاقتين، والنموذج المُستخدم في هذا البرنامج التعليمي هو Voxtral-Small-24B-2507. يُقدَّم مثالان للاختبار: النسخ الصوتي وفهم الصوت.

2. عرض التأثير

النسخ الصوتي

فهم الصوت

3. خطوات التشغيل

1. ابدأ تشغيل الحاوية

2. خطوات الاستخدام

إذا ظهرت رسالة "بوابة غير صالحة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لكبر حجم النموذج، يُرجى الانتظار من ٥ إلى ١٠ دقائق ثم تحديث الصفحة.

1. النسخ الصوتي

2. فهم الصوت

4. المناقشة

🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓