HyperAIHyperAI

Command Palette

Search for a command to run...

نموذج استنساخ الصوت NeuTTS-Air لنشر وحدة المعالجة المركزية

1. مقدمة البرنامج التعليمي

النجوم

NeuTTS-Air هو نموذج توليف كلامي شامل (TTS) أصدرته شركة Neuphonic في أكتوبر 2025. يعتمد النموذج على بنية Qwen LLM الأساسية بسرعة 0.5B وترميز الصوت NeuCodec، ويُظهر قدرات تعلم سريعة في النشر على الجهاز واستنساخ الصوت الفوري. يُظهر تقييم النظام أن NeuTTS Air قد وصل إلى مستوى SOTA بين نماذج المصدر المفتوح، وخاصةً في معايير التوليف فائقة الواقعية والاستدلال الفوري. كما يُمكنه التعميم على سيناريوهات جديدة مثل العوامل المُضمنة ونقل الأنماط، ودعم استنساخ الصوت لمدة 3 ثوانٍ، وإنشاء محتوى محادثة طبيعي. يُقدم التدريب اللاحق دعم GGML/ONNX وآلية وضع العلامات المائية، مما يجعله رائدًا في مجال المصادر المفتوحة في تقييم توليف الكلامي على الجهاز وتحسين الطاقة، وبعض السيناريوهات تُضاهي نماذج المصدر المغلق.

يستخدم هذا البرنامج التعليمي موارد وحدة المعالجة المركزية، ويدعم النموذج اللغة الإنجليزية فقط، ويستغرق توليف الصوت أكثر من نصف دقيقة. إذا كنت ترغب في تجربة سرعة معالجة أعلى، يمكنك استخدام بطاقة RTX 5090 Clone Tutorial واحدة.NeuTTS-Air: نموذج استنساخ صوتي خفيف الوزن وفعال".

2. أمثلة المشاريع

3. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

2. بمجرد دخولك إلى صفحة الويب، يمكنك استخدام النموذج

إذا ظهرت رسالة "بوابة سيئة"، فهذا يعني أن الكود قيد التنفيذ في الخلفية. يُرجى الانتظار دقيقتين أو ثلاث دقائق ثم تحديث الصفحة.

عند استخدام متصفح Safari، قد لا يتم تشغيل الصوت مباشرة ويجب تنزيله قبل التشغيل.

كيفية الاستخدام

الحد الأدنى لطول الصوت المدخل هو 3 ثوانٍ، والطول الموصى به هو من 3 إلى 15 ثانية.  الحد الأقصى لطول الصوت الصادر هو حوالي 30 ثانية 

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp