1. مقدمة البرنامج التعليمي

NeuTTS-Air هو نموذج توليف كلامي شامل (TTS) أصدرته شركة Neuphonic في أكتوبر 2025. يعتمد النموذج على بنية Qwen LLM الأساسية بسرعة 0.5B وترميز الصوت NeuCodec، ويُظهر قدرات تعلم سريعة في النشر على الجهاز واستنساخ الصوت الفوري. يُظهر تقييم النظام أن NeuTTS Air قد وصل إلى مستوى SOTA بين نماذج المصدر المفتوح، وخاصةً في معايير التوليف فائقة الواقعية والاستدلال الفوري. كما يُمكنه التعميم على سيناريوهات جديدة مثل العوامل المُضمنة ونقل الأنماط، ودعم استنساخ الصوت لمدة 3 ثوانٍ، وإنشاء محتوى محادثة طبيعي. يُقدم التدريب اللاحق دعم GGML/ONNX وآلية وضع العلامات المائية، مما يجعله رائدًا في مجال المصادر المفتوحة في تقييم توليف الكلامي على الجهاز وتحسين الطاقة، وبعض السيناريوهات تُضاهي نماذج المصدر المغلق.

يستخدم هذا البرنامج التعليمي بطاقة RTX 5090 واحدة كمورد، والطراز يدعم اللغة الإنجليزية فقط.

3. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

2. بمجرد دخولك إلى صفحة الويب، يمكنك استخدام النموذج

إذا ظهرت رسالة "بوابة سيئة"، فهذا يعني أن الكود قيد التنفيذ في الخلفية. يُرجى الانتظار دقيقتين أو ثلاث دقائق ثم تحديث الصفحة.

عند استخدام متصفح Safari، قد لا يتم تشغيل الصوت مباشرة ويجب تنزيله قبل التشغيل.

كيفية الاستخدام

HyperAI

تشغيل هذا Notebook

التاريخ

منذ 3 أشهر

الحجم

616.92 KB

الوسوم

Text-to-Audio

الترخيص

Apache 2.0

GitHub

neuphonic/neutts-air

1. مقدمة البرنامج التعليمي

يستخدم هذا البرنامج التعليمي بطاقة RTX 5090 واحدة كمورد، والطراز يدعم اللغة الإنجليزية فقط.

2. أمثلة المشاريع

3. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

2. بمجرد دخولك إلى صفحة الويب، يمكنك استخدام النموذج

إذا ظهرت رسالة "بوابة سيئة"، فهذا يعني أن الكود قيد التنفيذ في الخلفية. يُرجى الانتظار دقيقتين أو ثلاث دقائق ثم تحديث الصفحة.

عند استخدام متصفح Safari، قد لا يتم تشغيل الصوت مباشرة ويجب تنزيله قبل التشغيل.

كيفية الاستخدام

تم المساهمة في هذا الدفتر من قبل مستخدمي المجتمع وهو مخصص لأغراض تعليمية وإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

تشغيل هذا Notebook

التاريخ

منذ 3 أشهر

الحجم

616.92 KB

الوسوم

Text-to-Audio

الترخيص

Apache 2.0

GitHub

neuphonic/neutts-air

1. مقدمة البرنامج التعليمي

يستخدم هذا البرنامج التعليمي بطاقة RTX 5090 واحدة كمورد، والطراز يدعم اللغة الإنجليزية فقط.

2. أمثلة المشاريع

3. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

2. بمجرد دخولك إلى صفحة الويب، يمكنك استخدام النموذج

إذا ظهرت رسالة "بوابة سيئة"، فهذا يعني أن الكود قيد التنفيذ في الخلفية. يُرجى الانتظار دقيقتين أو ثلاث دقائق ثم تحديث الصفحة.

عند استخدام متصفح Safari، قد لا يتم تشغيل الصوت مباشرة ويجب تنزيله قبل التشغيل.

كيفية الاستخدام

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

منذ 2 أشهر

Open-AutoGLM: مساعد ذكي للأجهزة المحمولة

منذ 2 أشهر

توليد الصوت kyutai-tts-1.6 b-en_fr

منذ شهر واحد

نشر Qwen-Image-Lightning بنقرة واحدة

منذ 2 أشهر

Dia2-TTS: خدمة توليف الكلام في الوقت الحقيقي

منذ 2 أشهر

خدمة VibeVoice-Realtime TTS: خدمة توليف الكلام في الوقت الفعلي

منذ 2 أشهر

نشر DeepSeek-R1-70B بنقرة واحدة

منذ 3 أشهر

Supertonic: نموذج توليف كلام TTS عالي السرعة يعتمد على ONNX

منذ 2 أشهر

SoulX-Podcast: توليد كلام نصي طويل بجودة البودكاست للعديد من اللهجات.

منذ 2 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

NeuTTS-Air: نموذج استنساخ صوتي خفيف الوزن وفعال

1. مقدمة البرنامج التعليمي

2. أمثلة المشاريع

3. خطوات التشغيل

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

NeuTTS-Air: نموذج استنساخ صوتي خفيف الوزن وفعال

1. مقدمة البرنامج التعليمي

2. أمثلة المشاريع

3. خطوات التشغيل

ذات صلة دفاتر تفاعلية

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

Open-AutoGLM: مساعد ذكي للأجهزة المحمولة

توليد الصوت kyutai-tts-1.6 b-en_fr

نشر Qwen-Image-Lightning بنقرة واحدة

Dia2-TTS: خدمة توليف الكلام في الوقت الحقيقي

خدمة VibeVoice-Realtime TTS: خدمة توليف الكلام في الوقت الفعلي

نشر DeepSeek-R1-70B بنقرة واحدة

Supertonic: نموذج توليف كلام TTS عالي السرعة يعتمد على ONNX

SoulX-Podcast: توليد كلام نصي طويل بجودة البودكاست للعديد من اللهجات.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

NeuTTS-Air: نموذج استنساخ صوتي خفيف الوزن وفعال

1. مقدمة البرنامج التعليمي

2. أمثلة المشاريع

3. خطوات التشغيل

ذات صلة دفاتر تفاعلية

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

Open-AutoGLM: مساعد ذكي للأجهزة المحمولة

توليد الصوت kyutai-tts-1.6 b-en_fr

نشر Qwen-Image-Lightning بنقرة واحدة

Dia2-TTS: خدمة توليف الكلام في الوقت الحقيقي

خدمة VibeVoice-Realtime TTS: خدمة توليف الكلام في الوقت الفعلي

نشر DeepSeek-R1-70B بنقرة واحدة

Supertonic: نموذج توليف كلام TTS عالي السرعة يعتمد على ONNX

SoulX-Podcast: توليد كلام نصي طويل بجودة البودكاست للعديد من اللهجات.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

ذات صلة دفاتر تفاعلية

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

Open-AutoGLM: مساعد ذكي للأجهزة المحمولة

توليد الصوت kyutai-tts-1.6 b-en_fr

نشر Qwen-Image-Lightning بنقرة واحدة

Dia2-TTS: خدمة توليف الكلام في الوقت الحقيقي

خدمة VibeVoice-Realtime TTS: خدمة توليف الكلام في الوقت الفعلي

نشر DeepSeek-R1-70B بنقرة واحدة

Supertonic: نموذج توليف كلام TTS عالي السرعة يعتمد على ONNX

SoulX-Podcast: توليد كلام نصي طويل بجودة البودكاست للعديد من اللهجات.

ذات صلة دفاتر تفاعلية

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

Open-AutoGLM: مساعد ذكي للأجهزة المحمولة

توليد الصوت kyutai-tts-1.6 b-en_fr

نشر Qwen-Image-Lightning بنقرة واحدة

Dia2-TTS: خدمة توليف الكلام في الوقت الحقيقي

خدمة VibeVoice-Realtime TTS: خدمة توليف الكلام في الوقت الفعلي

نشر DeepSeek-R1-70B بنقرة واحدة

Supertonic: نموذج توليف كلام TTS عالي السرعة يعتمد على ONNX

SoulX-Podcast: توليد كلام نصي طويل بجودة البودكاست للعديد من اللهجات.