3. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

2. خطوات الاستخدام

إذا ظهرت رسالة "بوابة غير صالحة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لكبر حجم النموذج، يُرجى الانتظار لمدة دقيقتين أو ثلاث دقائق ثم تحديث الصفحة. عند استخدام متصفح سفاري، قد لا يتم تشغيل الصوت مباشرةً، ويجب تنزيله قبل التشغيل.

*يسمح لك هذا البرنامج التعليمي بالاختيار بين إنشاء صوت لاعب واحد (فردي) وإنشاء صوت حوار لاعبين (الدور) في "وضع إدخال الصوت".

HyperAI

تشغيل هذا Notebook ناقش على Discord

التاريخ

منذ 2 أشهر

الحجم

8.4 MB

الوسوم

Text-to-Audio

الترخيص

Apache 2.0

GitHub

OpenMOSS/MOSS-TTSD

رابط الورقة البحثية

www.open-moss.com

1. مقدمة البرنامج التعليمي

يستخدم هذا البرنامج التعليمي بطاقة RTX 5090 واحدة كمورد.

2. أمثلة المشاريع

3. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

2. خطوات الاستخدام

إذا ظهرت رسالة "بوابة غير صالحة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لكبر حجم النموذج، يُرجى الانتظار لمدة دقيقتين أو ثلاث دقائق ثم تحديث الصفحة. عند استخدام متصفح سفاري، قد لا يتم تشغيل الصوت مباشرةً، ويجب تنزيله قبل التشغيل.

معلومات الاستشهاد

معلومات الاستشهاد لهذا المشروع هي كما يلي:

@article{moss2025ttsd,
  title={Text to Spoken Dialogue Generation}, 
  author={OpenMOSS Team},
  year={2025}
}

تم المساهمة في هذا الدفتر من قبل مستخدمي المجتمع وهو مخصص لأغراض تعليمية وإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

تشغيل هذا Notebook ناقش على Discord

التاريخ

منذ 2 أشهر

الحجم

8.4 MB

الوسوم

Text-to-Audio

الترخيص

Apache 2.0

GitHub

OpenMOSS/MOSS-TTSD

رابط الورقة البحثية

www.open-moss.com

1. مقدمة البرنامج التعليمي

يستخدم هذا البرنامج التعليمي بطاقة RTX 5090 واحدة كمورد.

2. أمثلة المشاريع

3. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

2. خطوات الاستخدام

إذا ظهرت رسالة "بوابة غير صالحة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لكبر حجم النموذج، يُرجى الانتظار لمدة دقيقتين أو ثلاث دقائق ثم تحديث الصفحة. عند استخدام متصفح سفاري، قد لا يتم تشغيل الصوت مباشرةً، ويجب تنزيله قبل التشغيل.

معلومات الاستشهاد

معلومات الاستشهاد لهذا المشروع هي كما يلي:

@article{moss2025ttsd,
  title={Text to Spoken Dialogue Generation}, 
  author={OpenMOSS Team},
  year={2025}
}

Krea-realtime-video: نموذج توليد الفيديو في الوقت الفعلي

منذ 3 أشهر

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

منذ 2 أشهر

ROCKET-2: لعبة ثلاثية الأبعاد Zero-Shot Transfer

منذ 2 أشهر

MAGE: مولد جينات الأجسام المضادة وحيدة النسيلة

منذ 2 أشهر

نشر Ministry-3-14B-Instruct بنقرة واحدة

منذ 2 أشهر

LongCat-Image: نظام ثنائي اللغة لتوليد الصور يعتمد على النصوص

منذ 2 أشهر

OCRFlux-3B: مجموعة أدوات التعرف على النصوص الذكية

منذ 3 أشهر

جارفيس آرت - معاينة برنامج تنقيح الصور الذكي

منذ شهر واحد

توليد الصوت kyutai-tts-1.6 b-en_fr

منذ شهر واحد

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

موس: توليد الحوار من النص إلى الكلام

1. مقدمة البرنامج التعليمي

2. أمثلة المشاريع

3. خطوات التشغيل

معلومات الاستشهاد

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

موس: توليد الحوار من النص إلى الكلام

1. مقدمة البرنامج التعليمي

2. أمثلة المشاريع

3. خطوات التشغيل

معلومات الاستشهاد

ذات صلة دفاتر تفاعلية

Krea-realtime-video: نموذج توليد الفيديو في الوقت الفعلي

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

ROCKET-2: لعبة ثلاثية الأبعاد Zero-Shot Transfer

MAGE: مولد جينات الأجسام المضادة وحيدة النسيلة

نشر Ministry-3-14B-Instruct بنقرة واحدة

LongCat-Image: نظام ثنائي اللغة لتوليد الصور يعتمد على النصوص

OCRFlux-3B: مجموعة أدوات التعرف على النصوص الذكية

جارفيس آرت - معاينة برنامج تنقيح الصور الذكي

توليد الصوت kyutai-tts-1.6 b-en_fr

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

موس: توليد الحوار من النص إلى الكلام

1. مقدمة البرنامج التعليمي

2. أمثلة المشاريع

3. خطوات التشغيل

معلومات الاستشهاد

ذات صلة دفاتر تفاعلية

Krea-realtime-video: نموذج توليد الفيديو في الوقت الفعلي

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

ROCKET-2: لعبة ثلاثية الأبعاد Zero-Shot Transfer

MAGE: مولد جينات الأجسام المضادة وحيدة النسيلة

نشر Ministry-3-14B-Instruct بنقرة واحدة

LongCat-Image: نظام ثنائي اللغة لتوليد الصور يعتمد على النصوص

OCRFlux-3B: مجموعة أدوات التعرف على النصوص الذكية

جارفيس آرت - معاينة برنامج تنقيح الصور الذكي

توليد الصوت kyutai-tts-1.6 b-en_fr

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

ذات صلة دفاتر تفاعلية

Krea-realtime-video: نموذج توليد الفيديو في الوقت الفعلي

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

ROCKET-2: لعبة ثلاثية الأبعاد Zero-Shot Transfer

MAGE: مولد جينات الأجسام المضادة وحيدة النسيلة

نشر Ministry-3-14B-Instruct بنقرة واحدة

LongCat-Image: نظام ثنائي اللغة لتوليد الصور يعتمد على النصوص

OCRFlux-3B: مجموعة أدوات التعرف على النصوص الذكية

جارفيس آرت - معاينة برنامج تنقيح الصور الذكي

توليد الصوت kyutai-tts-1.6 b-en_fr

ذات صلة دفاتر تفاعلية

Krea-realtime-video: نموذج توليد الفيديو في الوقت الفعلي

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

ROCKET-2: لعبة ثلاثية الأبعاد Zero-Shot Transfer

MAGE: مولد جينات الأجسام المضادة وحيدة النسيلة

نشر Ministry-3-14B-Instruct بنقرة واحدة

LongCat-Image: نظام ثنائي اللغة لتوليد الصور يعتمد على النصوص

OCRFlux-3B: مجموعة أدوات التعرف على النصوص الذكية

جارفيس آرت - معاينة برنامج تنقيح الصور الذكي

توليد الصوت kyutai-tts-1.6 b-en_fr