HyperAI

Orpheus TTS: نموذج تحويل النص إلى كلام متعدد اللغات

صورة
يبني
الترخيص: أباتشي

1. مقدمة البرنامج التعليمي

Orpheus-TTS هو نموذج تحويل النص إلى كلام (TTS) أصدره فريق Canopy Labs في 18 مارس 2025. يمكن للنموذج توليد كلام طبيعي وعاطفي وقريب من مستوى الإنسان، ولديه قدرات استنساخ صوت بدون عينة، ويمكنه تقليد أصوات معينة دون تدريب مسبق. يمكن للمستخدمين استخدام العلامات للتحكم في التعبير العاطفي للصوت وتعزيز واقعية الصوت. يتمتع Orpheus TTS بزمن انتقال منخفض يبلغ حوالي 200 مللي ثانية، مما يجعله مناسبًا للتطبيقات في الوقت الفعلي.

يستخدم هذا البرنامج التعليمي الموارد لبطاقة RTX 4090 واحدة.

2. أمثلة المشاريع

3. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 1-2 دقيقة وتحديث الصفحة.

2. بعد الدخول إلى صفحة الويب، يمكنك بدء محادثة مع النموذج

❗️نصائح هامة للاستخدام:

  • درجة حرارة: السيطرة على عشوائية وإبداع الجيل.
  • أعلى ص: يتحكم في نطاق اختيار الرموز المرشحة.
  • عقوبة التكرار: قمع الأنماط المتكررة في الكلام.
  • الطول الأقصى: يتحكم في مدة الصوت الناتج.

كيفية الاستخدام

عند استخدام متصفح Safari، قد لا يتم تشغيل الصوت مباشرة ويجب تنزيله قبل التشغيل. التأثير الإنجليزي أفضل من التأثير الصيني.

4. المناقشة

🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓

دعم المشاريع

شكرًا لمستخدم Github xxxجججج1  نشر هذا البرنامج التعليمي.