DiffRhythm: إنشاء عرض توضيحي كامل للموسيقى في دقيقة واحدة
نشر DiffRhythm-full بنقرة واحدة

1. مقدمة البرنامج التعليمي
DiffRhythm هي أداة لتوليد الموسيقى من البداية إلى النهاية تعتمد على نموذج الانتشار الكامن، والتي تم تطويرها بشكل مشترك من قبل مختبر معالجة الكلام والصوت واللغة في جامعة نورث وسترن بوليتكنيك (ASLP@NPU) وجامعة هونج كونج الصينية، شنتشن. يمكنه إنشاء أغنية كاملة تصل مدتها إلى 4 دقائق و45 ثانية، بما في ذلك الغناء والمرافقة، في وقت قصير. كل ما يحتاجه المستخدمون هو تقديم كلمات الأغاني وتلميحات الأسلوب، ويمكن لـ DiffRhythm إنشاء الألحان والموسيقى المرافقة تلقائيًا والتي تتوافق مع كلمات الأغاني، مع دعم الإدخال متعدد اللغات.
DiffRhythm (بالصينية: 狄韵، Dì Yùn) هو أول نموذج لتوليد الأغاني يعتمد على الانتشار وقادر على تأليف أغانٍ كاملة. يجمع الاسم بين "Diff" (إشارة إلى هندسته المعمارية المنتشرة) و"Rhythm" (للتأكيد على تركيزه على الموسيقى وكتابة الأغاني). الاسم الصيني دي يون (Di Yun) مشابه في النطق لـ "DiffRhythm"، حيث يرمز "Dì" (الاستماع باهتمام) إلى الإدراك السمعي ويمثل "Yun" (السحر اللحني) الموسيقى.
2. خطوات التشغيل
1. ابدأ تشغيل الحاوية
بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب. نظرًا للنموذج الكبير، يستغرق عرض واجهة WebUI حوالي 3 دقائق، وإلا فسيتم عرض "بوابة سيئة"

2. توليد الموسيقى
2.1 اختر إنشاء الموسيقى بناءً على الكلمات أو الصوت

2.2 يمكنك اختيار إنشاء موسيقى بناءً على الكلمات أو النص

3. المناقشة
🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓
