Dia-1.6B: عرض توضيحي لتوليف الكلام العاطفي

1. مقدمة البرنامج التعليمي
Dia-1.6B هو نموذج تحويل النص إلى كلام أصدره فريق Nari Labs في 21 أبريل 2025. وهو قادر على إنشاء محادثات واقعية للغاية مباشرة من نصوص نصية ويدعم التحكم في العواطف والتجويد المستند إلى الصوت. بالإضافة إلى ذلك، يمكن لـ Dia-1.6B أيضًا توليد أصوات التواصل غير اللفظي، مثل الضحك والسعال وتنظيف الحلق وما إلى ذلك، مما يجعل المحادثات أكثر طبيعية وحيوية. لا يدعم هذا النموذج إنشاء حوار متعدد الأدوار فحسب، بل يمكنه أيضًا التمييز بين الأدوار من خلال تسميات مثل [S1] و[S2]، وإنشاء حوارات متعددة الأدوار في لقطة واحدة، والحفاظ على الإيقاع الطبيعي والانتقالات العاطفية. يدعم هذا المشروع أيضًا تحميل عينات الصوت الخاصة بك. سوف يقوم النموذج بإنشاء أصوات مماثلة بناءً على العينات لتحقيق استنساخ بصمة صوتية بدون عينة.
يستخدم هذا البرنامج التعليمي الموارد لبطاقة RTX 4090 واحدة ويدعم حاليًا الجيل الإنجليزي فقط.
👉 يقدم هذا المشروع نموذجًا لـ:
- قطر – 1.6 ب: يحتوي على نموذج تحويل النص إلى كلام بمعلمة 1.6B.
2. أمثلة المشاريع

2. خطوات التشغيل
1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب
إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 1-2 دقيقة وتحديث الصفحة.

2. بعد الدخول إلى صفحة الويب، يمكنك بدء محادثة مع النموذج
وصف المعلمة:
- الحد الأقصى للرموز الجديدة:يتحكم في طول الصوت الناتج.
- مقياس CFG:ضبط الدرجة التي يتوافق بها التوليد مع شروط الإدخال.
- درجة حرارة:يتحكم في عشوائية النتائج المولدة.
- أعلى P:السيطرة على تنوع اختيار المرشحين.
- فلتر CFG العلوي K:بالإضافة إلى تصفية Top K من CFG، يتم تحقيق التوازن بين الصلة والتنوع.
- عامل السرعة:ضبط سرعة التشغيل أو الإيقاع الناتج للصوت الناتج.
كيفية الاستخدام
أدخل النص الناتج في "إدخال النص" واستخدم علامتي [S1] و[S2] للتمييز بين حوارات الشخصيات. إذا كان هناك جرسان مختلفان في الصوت المرجعي، فإننا نضع علامة عليهما على النحو التالي: S1 (الجرس الأول) وS2 (الجرس الثاني) على التوالي. سوف يتوافق جرس صوت الشخصية بشكل واحد لواحد مع الجرسين الموجودين في الصوت المرجعي. إذا كان هناك جرس في الصوت المرجعي، فإننا نضع علامة عليه كـ S1 (الجرس الأول).

التبادل والمناقشة
🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓
