HyperAIHyperAI

Command Palette

Search for a command to run...

فصل مصدر الموسيقى باستخدام RNN المقسم حسب النطاق

Yi Luo Jianwei Yu

الملخص

تحسّن أداء نماذج فصل مصادر الموسيقى (MSS) بشكل كبير في السنوات الأخيرة بفضل تطور الهياكل الشبكية العصبية الجديدة وخطوط التدريب المتطورة. ومع ذلك، كانت التصاميم الحديثة للنماذج في مجال فصل مصادر الموسيقى مدفوعة في المقام الأول بمهام معالجة الصوت الأخرى أو مجالات بحثية أخرى، بينما لم تُستكشف الخصائص والأنماط الجوهرية للإشارات الموسيقية بشكل كامل. في هذا البحث، نقترح نموذج RNN المقسم حسب النطاق الترددي (BSRNN)، وهو نموذج في مجال التردد يقوم بفصل طيف الخلط إلى نطاقات فرعية بشكل صريح، ثم يُطبّق نمذجة متداخلة على مستوى النطاقات وعلى مستوى التسلسل. ويمكن تحديد عرض النطاقات الفرعية بناءً على معرفة مسبقة أو معرفة خبراء حول خصائص المصدر المستهدف، بهدف تحسين الأداء بالنسبة لنوع معين من الآلات الموسيقية المستهدفة. ولتحسين استغلال البيانات غير المُعلَّمة، نُقدّم أيضًا خط أنابيب لإعادة تدريب نموذج شبه مُعلَّم يمكنه تحسين الأداء بشكل إضافي. تُظهر نتائج التجارب أن نموذج BSRNN المدرب فقط على مجموعة بيانات MUSDB18-HQ يتفوّق بشكل ملحوظ على عدة نماذج من بين النماذج الرائدة في مسابقة فصل الموسيقى (MDX) لعام 2021، كما أن مرحلة إعادة التدريب شبه المُعلَّمة تُحسّن الأداء بشكل إضافي على جميع المسارات الأربعة للآلات الموسيقية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
فصل مصدر الموسيقى باستخدام RNN المقسم حسب النطاق | مستندات | HyperAI