HyperAIHyperAI
منذ 15 أيام

فصل مصدر الموسيقى باستخدام RNN المقسم حسب النطاق

Yi Luo, Jianwei Yu
فصل مصدر الموسيقى باستخدام RNN المقسم حسب النطاق
الملخص

تحسّن أداء نماذج فصل مصادر الموسيقى (MSS) بشكل كبير في السنوات الأخيرة بفضل تطور الهياكل الشبكية العصبية الجديدة وخطوط التدريب المتطورة. ومع ذلك، كانت التصاميم الحديثة للنماذج في مجال فصل مصادر الموسيقى مدفوعة في المقام الأول بمهام معالجة الصوت الأخرى أو مجالات بحثية أخرى، بينما لم تُستكشف الخصائص والأنماط الجوهرية للإشارات الموسيقية بشكل كامل. في هذا البحث، نقترح نموذج RNN المقسم حسب النطاق الترددي (BSRNN)، وهو نموذج في مجال التردد يقوم بفصل طيف الخلط إلى نطاقات فرعية بشكل صريح، ثم يُطبّق نمذجة متداخلة على مستوى النطاقات وعلى مستوى التسلسل. ويمكن تحديد عرض النطاقات الفرعية بناءً على معرفة مسبقة أو معرفة خبراء حول خصائص المصدر المستهدف، بهدف تحسين الأداء بالنسبة لنوع معين من الآلات الموسيقية المستهدفة. ولتحسين استغلال البيانات غير المُعلَّمة، نُقدّم أيضًا خط أنابيب لإعادة تدريب نموذج شبه مُعلَّم يمكنه تحسين الأداء بشكل إضافي. تُظهر نتائج التجارب أن نموذج BSRNN المدرب فقط على مجموعة بيانات MUSDB18-HQ يتفوّق بشكل ملحوظ على عدة نماذج من بين النماذج الرائدة في مسابقة فصل الموسيقى (MDX) لعام 2021، كما أن مرحلة إعادة التدريب شبه المُعلَّمة تُحسّن الأداء بشكل إضافي على جميع المسارات الأربعة للآلات الموسيقية.

فصل مصدر الموسيقى باستخدام RNN المقسم حسب النطاق | أحدث الأوراق البحثية | HyperAI