مقدمة البرنامج التعليمي

Parler-TTS هو نموذج خفيف الوزن لتحويل النص إلى كلام، قادر على توليد كلام طبيعي عالي الجودة بأسلوب المتحدث. يوفر هذا النموذج درجة عالية من المرونة والابتكار، ويتيح التحكم في جنس المتحدث، ونبرة صوته، وتنغيمه، والسياق (داخلي، خارجي، شارع، قاعة حفلات، إلخ) عبر توجيهات صوتية. وهو مبني على ورقة بحثية من إعداد Stability AI ودان ليث وسيمون كينغ من جامعة إدنبرة. دليل اللغة الطبيعية لتحويل النص إلى كلام عالي الدقة مع التعليقات الاصطناعية إعادة إنتاج الكود.

على عكس نماذج TTS الأخرى، فإن Parler-TTS مفتوح المصدر تمامًا. يتم إصدار جميع مجموعات البيانات والمعالجة المسبقة ورمز التدريب والأوزان علنًا بموجب ترخيص، مما يتيح للمجتمع الاستفادة من عمل هذا البرنامج التعليمي لتطوير نماذج TTS القوية الخاصة بهم. ملحوظة: هذا النموذج لا يدعم اللغة الصينية بعد

خطوات التشغيل

1. 克隆并启动容器，等待约 30s（加载模型），点击 API 地址即可进入 Web 界面（使用 RTX 4090 即可启动）

2. 输入要生成的文字和风格描述，点击提交即可生成

• نص الإدخال: النص الذي يحتاج إلى تحويله إلى كلام

• الوصف: وصف دور الصوت والمشهد والنغمة والجرس والمعلومات الأخرى، على غرار الموجه. على سبيل المثال: يتحدث صوت الرجل ببطء قليلاً مع خلفية صاخبة للغاية، ويحمل نغمة منخفضة ويعرض لمسة من التعبير والحيوية. الصوت بعيد جدًا، ويضيف جوًا من التشويق.

• إنشاء Parler-TTS: ملفات صوتية تم إنشاؤها (يمكن الاستماع إليها وتنزيلها)

التبادل والمناقشة

🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓

HyperAI

تشغيل هذا Notebook ناقش على Discord

التاريخ

منذ عام واحد

الحجم

175.55 MB

الوسوم

تصنيف الصوت

رابط الورقة البحثية

www.text-description-to-speech.com

مقدمة البرنامج التعليمي

خطوات التشغيل

1. 克隆并启动容器，等待约 30s（加载模型），点击 API 地址即可进入 Web 界面（使用 RTX 4090 即可启动）

2. 输入要生成的文字和风格描述，点击提交即可生成

• نص الإدخال: النص الذي يحتاج إلى تحويله إلى كلام

• إنشاء Parler-TTS: ملفات صوتية تم إنشاؤها (يمكن الاستماع إليها وتنزيلها)

التبادل والمناقشة

تم المساهمة في هذا الدفتر من قبل مستخدمي المجتمع وهو مخصص لأغراض تعليمية وإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

تشغيل هذا Notebook ناقش على Discord

التاريخ

منذ عام واحد

الحجم

175.55 MB

الوسوم

تصنيف الصوت

رابط الورقة البحثية

www.text-description-to-speech.com

مقدمة البرنامج التعليمي

خطوات التشغيل

1. 克隆并启动容器，等待约 30s（加载模型），点击 API 地址即可进入 Web 界面（使用 RTX 4090 即可启动）

2. 输入要生成的文字和风格描述，点击提交即可生成

• نص الإدخال: النص الذي يحتاج إلى تحويله إلى كلام

• إنشاء Parler-TTS: ملفات صوتية تم إنشاؤها (يمكن الاستماع إليها وتنزيلها)

التبادل والمناقشة

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

منذ 2 أشهر

توليد الصوت kyutai-tts-1.6 b-en_fr

منذ شهر واحد

Pocket-TTS: نظام تحويل النص إلى كلام عالي الجودة وخفيف الوزن للبث المباشر

منذ 18 أيام

Dia2-TTS: خدمة توليف الكلام في الوقت الحقيقي

منذ 2 أشهر

خدمة VibeVoice-Realtime TTS: خدمة توليف الكلام في الوقت الفعلي

منذ 2 أشهر

Supertonic: نموذج توليف كلام TTS عالي السرعة يعتمد على ONNX

منذ 2 أشهر

نشر Qwen-Image-Lightning بنقرة واحدة

منذ 2 أشهر

نشر نموذج الاستدلال الطبي MedGemma-27b-text-it بنقرة واحدة

منذ 3 أشهر

نشر نموذج SmolLM3-3B بنقرة واحدة

منذ 3 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

نشر Parler-TTS بنقرة واحدة

مقدمة البرنامج التعليمي

خطوات التشغيل

التبادل والمناقشة

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

نشر Parler-TTS بنقرة واحدة

مقدمة البرنامج التعليمي

خطوات التشغيل

التبادل والمناقشة

ذات صلة دفاتر تفاعلية

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

توليد الصوت kyutai-tts-1.6 b-en_fr

Pocket-TTS: نظام تحويل النص إلى كلام عالي الجودة وخفيف الوزن للبث المباشر

Dia2-TTS: خدمة توليف الكلام في الوقت الحقيقي

خدمة VibeVoice-Realtime TTS: خدمة توليف الكلام في الوقت الفعلي

Supertonic: نموذج توليف كلام TTS عالي السرعة يعتمد على ONNX

نشر Qwen-Image-Lightning بنقرة واحدة

نشر نموذج الاستدلال الطبي MedGemma-27b-text-it بنقرة واحدة

نشر نموذج SmolLM3-3B بنقرة واحدة

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

نشر Parler-TTS بنقرة واحدة

مقدمة البرنامج التعليمي

خطوات التشغيل

التبادل والمناقشة

ذات صلة دفاتر تفاعلية

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

توليد الصوت kyutai-tts-1.6 b-en_fr

Pocket-TTS: نظام تحويل النص إلى كلام عالي الجودة وخفيف الوزن للبث المباشر

Dia2-TTS: خدمة توليف الكلام في الوقت الحقيقي

خدمة VibeVoice-Realtime TTS: خدمة توليف الكلام في الوقت الفعلي

Supertonic: نموذج توليف كلام TTS عالي السرعة يعتمد على ONNX

نشر Qwen-Image-Lightning بنقرة واحدة

نشر نموذج الاستدلال الطبي MedGemma-27b-text-it بنقرة واحدة

نشر نموذج SmolLM3-3B بنقرة واحدة

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

ذات صلة دفاتر تفاعلية

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

توليد الصوت kyutai-tts-1.6 b-en_fr

Pocket-TTS: نظام تحويل النص إلى كلام عالي الجودة وخفيف الوزن للبث المباشر

Dia2-TTS: خدمة توليف الكلام في الوقت الحقيقي

خدمة VibeVoice-Realtime TTS: خدمة توليف الكلام في الوقت الفعلي

Supertonic: نموذج توليف كلام TTS عالي السرعة يعتمد على ONNX

نشر Qwen-Image-Lightning بنقرة واحدة

نشر نموذج الاستدلال الطبي MedGemma-27b-text-it بنقرة واحدة

نشر نموذج SmolLM3-3B بنقرة واحدة

ذات صلة دفاتر تفاعلية

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

توليد الصوت kyutai-tts-1.6 b-en_fr

Pocket-TTS: نظام تحويل النص إلى كلام عالي الجودة وخفيف الوزن للبث المباشر

Dia2-TTS: خدمة توليف الكلام في الوقت الحقيقي

خدمة VibeVoice-Realtime TTS: خدمة توليف الكلام في الوقت الفعلي

Supertonic: نموذج توليف كلام TTS عالي السرعة يعتمد على ONNX

نشر Qwen-Image-Lightning بنقرة واحدة

نشر نموذج الاستدلال الطبي MedGemma-27b-text-it بنقرة واحدة

نشر نموذج SmolLM3-3B بنقرة واحدة