Dia-1.6B: عرض توضيحي لتوليف الكلام العاطفي
1. مقدمة البرنامج التعليمي
يستخدم هذا البرنامج التعليمي الموارد لبطاقة RTX 4090 واحدة ويدعم حاليًا الجيل الإنجليزي فقط.
👉 يقدم هذا المشروع نموذجًا لـ:
- قطر – 1.6 ب: يحتوي على نموذج تحويل النص إلى كلام بمعلمة 1.6B.
2. أمثلة المشاريع

2. خطوات التشغيل
1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب
إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 1-2 دقيقة وتحديث الصفحة.

2. بعد الدخول إلى صفحة الويب، يمكنك بدء محادثة مع النموذج
وصف المعلمة:
- الحد الأقصى للرموز الجديدة:يتحكم في طول الصوت الناتج.
- مقياس CFG:ضبط الدرجة التي يتوافق بها التوليد مع شروط الإدخال.
- درجة حرارة:يتحكم في عشوائية النتائج المولدة.
- أعلى P:السيطرة على تنوع اختيار المرشحين.
- فلتر CFG العلوي K:بالإضافة إلى تصفية Top K من CFG، يتم تحقيق التوازن بين الصلة والتنوع.
- عامل السرعة:ضبط سرعة التشغيل أو الإيقاع الناتج للصوت الناتج.
كيفية الاستخدام
أدخل النص الناتج في "إدخال النص" واستخدم علامتي [S1] و[S2] للتمييز بين حوارات الشخصيات. إذا كان هناك جرسان مختلفان في الصوت المرجعي، فيمكن تسميتهما S1 (الجرس الأول) وS2 (الجرس الثاني) على التوالي. سوف يتوافق جرس صوت الشخصية بشكل واحد لواحد مع الجرسين الموجودين في الصوت المرجعي. إذا كان هناك صوت في ملف الصوت المرجعي، فيمكن وضع علامة عليه بـ S1 (الصوت الأول).

التبادل والمناقشة
🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓
