HyperAI

برنامج تعليمي عبر الإنترنت | أول نموذج صوتي مفتوح المصدر من Mistral AI يأخذ في الاعتبار إصدارات Voxtral و24B و3B فهم الكلام العميق في سيناريوهات متعددة

特色图像

باعتباره أكثر طرق التفاعل البشري طبيعية، أصبح الصوت تدريجيًا العنصر الأساسي في التفاعل بين الإنسان والحاسوب. ومع شيوع التفاعل الصوتي، تتطور نماذج الصوت باستمرار وتُحسّن وفقًا للطلب.ومع ذلك، يصاحب التطور السريع استقطاب في عرض السوق: فنماذج المصدر المفتوح منخفضة التكلفة أكثر عرضة لمشاكل مثل ارتفاع معدلات الأخطاء وضعف الفهم الدلالي، بينما نماذج المصدر المغلق عالية التكلفة عادةً ما تكون باهظة الثمن وتعاني من قيود في النشر. ويصعب على كلا النموذجين تلبية الاحتياجات المتنوعة.

وبناء على هذا،أطلقت شركة Mistral AI مؤخرًا رسميًا أول نموذج صوتي متقدم لها، Voxtral، والذي يركز على نقاط الألم في سوق الذكاء الصوتي مع الأداء العالي والتكلفة المنخفضة مفتوح المصدر.يتوفر هذا النموذج بنسختين: 24B و3B. النسخة الأولى مناسبة للنشر واسع النطاق على مستوى المؤسسات، بينما تُسهّل النسخة الثانية عملية النشر الفردي البسيط. من حيث الوظائف، وبفضل النسخ الصوتي الممتاز وقدرات الفهم العميق، يدعم Voxtral لغات متعددة، ومعالجة سياق النصوص الطويلة، ووظائف مدمجة للإجابة على الأسئلة والتلخيص، ويتفوق أداؤه على نماذج الصوت مفتوحة المصدر الحالية في العديد من المعايير. في الوقت نفسه، يتميز بتكلفة أقل واستخدام واسع في مختلف السيناريوهات، مما يُسهم في تعميم التفاعل الصوتي.

تستخدم شركة Voxtral التكنولوجيا لتعزيز التغيير النوعي في نماذج التفاعل الصوتي من "قابلة للاستخدام" إلى "سهلة الاستخدام".فهو لا يلبي فقط طلب السوق على نماذج الصوت عالية الأداء، بل يعمل أيضًا على توسيع سيناريوهات تطبيق التفاعل الصوتي، وبناء حجر الزاوية البيئي الذكي للحوار الطبيعي.

「نموذج فهم الكلام Voxtral-Small-3B/24B-2507 التجريبي」أصبح قسم "البرنامج التعليمي" في الموقع الرسمي لـ HyperAI (hyper.ai) متاحًا الآن على الإنترنت.دعونا نبدأ تجربة غامرة للتفاعل الصوتي حيث يمكننا "السماع بشكل أكثر دقة والفهم بشكل أعمق" ونشهد اختراقات جديدة في نماذج الصوت المتقدمة!

رابط البرنامج التعليمي:

* نموذج فهم الكلام Voxtral-Mini-3B-2507 التجريبي:

https://go.hyper.ai/5Q9uT

نموذج فهم الكلام Voxtral-Small-24B-2507 التجريبي:

https://go.hyper.ai/p4X0s

اختبر المؤلف البرنامج باستخدام مقاطع من مقابلات براد بيت، بطل فيلم "فورمولا 1: وايلد ريس"، ووانغ نينغ، مؤسس بوب مارت، في مقابلة أجرتها معه قناة CCTV. كانت النتائج مثالية للغاية، مؤكدةً فعالية وظائف Voxtral.

مثال على النسخ الصوتي
مثال على فهم الصوت

تشغيل تجريبي

1. بعد الدخول إلى الصفحة الرئيسية لـ hyper.ai، حدد صفحة "البرنامج التعليمي"، ثم حدد "Voxtral-Mini-3B-2507 Speech Understanding Model Demo"، ثم انقر فوق "تشغيل هذا البرنامج التعليمي عبر الإنترنت".

2. بعد الانتقال إلى الصفحة التالية، انقر فوق "استنساخ" في الزاوية اليمنى العليا لاستنساخ البرنامج التعليمي في الحاوية الخاصة بك.

٣. اختر صورتي "NVIDIA GeForce RTX 4090" و"PyTorch"، ثم اختر "الدفع الفوري" أو "الباقة اليومية/الأسبوعية/الشهرية" حسب احتياجاتك، ثم انقر على "متابعة". يمكن للمستخدمين الجدد التسجيل باستخدام رابط الدعوة أدناه للحصول على ٤ ساعات من بطاقة RTX 4090 + ٥ ساعات من وقت فراغ المعالج!

رابط دعوة حصرية لـ HyperAI (انسخ وافتح في المتصفح):

https://openbayes.com/console/signup?r=Ada0322_NR0n

٤. انتظر حتى يتم تخصيص الموارد. سيستغرق الاستنساخ الأول حوالي ٣ دقائق. عندما تتغير الحالة إلى "قيد التشغيل"، انقر على سهم الانتقال بجوار "عنوان واجهة برمجة التطبيقات" للانتقال إلى صفحة العرض التوضيحي. يُرجى العلم أنه يجب على المستخدمين إكمال مصادقة الاسم الحقيقي قبل استخدام وظيفة الوصول إلى عنوان واجهة برمجة التطبيقات.

عرض التأثير

اختبر المؤلف البرنامج باستخدام مقاطع من مقابلات براد بيت، بطل فيلم "فورمولا 1: وايلد ريس"، ووانغ نينغ، مؤسس بوب مارت، في مقابلة أجرتها معه قناة CCTV. كانت النتائج مثالية للغاية، مؤكدةً فعالية وظائف Voxtral.

اختر وظيفة اختبار "نسخ الصوت"، ثم حمّل مقطعًا صوتيًا، ثم اختر اللغة، وانقر على "نسخ الصوت". ستظهر النتيجة بعد قليل.

قم باختيار وظيفة اختبار "فهم الصوت"، ثم قم بتحميل مقطع صوتي، وأدخل السؤال، ثم انقر على "إرسال الاستعلام"، وسيتم توليد النتائج بعد فترة.

بالإضافة إلى ذلك، يُعد إصدار 24B الذي توفره Voxtral مناسبًا للنشر واسع النطاق على مستوى المؤسسات. وهو متاح الآن في قسم "الدليل التعليمي" على الموقع الرسمي لـ HyperAI (hyper.ai)، ويمكن للمستخدمين تجربته حسب الحاجة!

رابط البرنامج التعليمي:

* نموذج فهم الكلام Voxtral-Mini-3B-2507 التجريبي:

https://go.hyper.ai/5Q9uT

نموذج فهم الكلام Voxtral-Small-24B-2507 التجريبي:

https://go.hyper.ai/p4X0s