NeuTTS-Air: نموذج استنساخ صوتي خفيف الوزن وفعال
1. مقدمة البرنامج التعليمي

NeuTTS-Air هو نموذج توليف كلامي شامل (TTS) أصدرته شركة Neuphonic في أكتوبر 2025. يعتمد النموذج على بنية Qwen LLM الأساسية بسرعة 0.5B وترميز الصوت NeuCodec، ويُظهر قدرات تعلم سريعة في النشر على الجهاز واستنساخ الصوت الفوري. يُظهر تقييم النظام أن NeuTTS Air قد وصل إلى مستوى SOTA بين نماذج المصدر المفتوح، وخاصةً في معايير التوليف فائقة الواقعية والاستدلال الفوري. كما يُمكنه التعميم على سيناريوهات جديدة مثل العوامل المُضمنة ونقل الأنماط، ودعم استنساخ الصوت لمدة 3 ثوانٍ، وإنشاء محتوى محادثة طبيعي. يُقدم التدريب اللاحق دعم GGML/ONNX وآلية وضع العلامات المائية، مما يجعله رائدًا في مجال المصادر المفتوحة في تقييم توليف الكلامي على الجهاز وتحسين الطاقة، وبعض السيناريوهات تُضاهي نماذج المصدر المغلق.
يستخدم هذا البرنامج التعليمي بطاقة RTX 5090 واحدة كمورد، والطراز يدعم اللغة الإنجليزية فقط.
2. أمثلة المشاريع

3. خطوات التشغيل
1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

2. بمجرد دخولك إلى صفحة الويب، يمكنك استخدام النموذج
إذا ظهرت رسالة "بوابة سيئة"، فهذا يعني أن الكود قيد التنفيذ في الخلفية. يُرجى الانتظار دقيقتين أو ثلاث دقائق ثم تحديث الصفحة.
عند استخدام متصفح Safari، قد لا يتم تشغيل الصوت مباشرة ويجب تنزيله قبل التشغيل.
كيفية الاستخدام
