HyperAIHyperAI
منذ 11 أيام

KUIELab-MDX-Net: شبكة عصبية ذات تدفقين للتفكيك الموسيقي

Minseok Kim, Woosung Choi, Jaehwa Chung, Daewon Lee, Soonyoung Jung
KUIELab-MDX-Net: شبكة عصبية ذات تدفقين للتفكيك الموسيقي
الملخص

في الآونة الأخيرة، تم اقتراح العديد من الطرق القائمة على التعلم العميق لفصل مصادر الموسيقى. وقد أظهرت بعض الطرق الرائدة في مجالها أن تراكيب طبقات متعددة مع العديد من الاتصالات الجانبية (skip connections) تُحسّن أداء معامل التحسين المطلق للإشارة (SDR). وعلى الرغم من أن مثل هذه البنية العميقة والمعقدة تُظهر أداءً متميزًا، إلا أنها تتطلب عادةً موارد حوسبة كبيرة ووقتًا طويلًا في التدريب والتقييم. تقدم هذه الورقة شبكة عصبية ذات تدفقين (two-stream neural network) لفصل موسيقى مدمجة، تُسمى KUIELab-MDX-Net، والتي تُظهر توازنًا جيدًا بين الأداء والموارد المطلوبة. يحتوي النموذج المقترح على فرع زمني-تكراري وفرع زمني، حيث يقوم كل فرع بفصل الأصوات بشكل منفصل. ثم يتم دمج النتائج الناتجة من الفرعين لإنتاج التقدير النهائي. وقد حصلت KUIELab-MDX-Net على المركز الثاني في قائمة التصنيف A والمركز الثالث في قائمة التصنيف B ضمن مسابقة فصل الموسيقى في مؤتمر ISMIR 2021. كما تُلخّص هذه الورقة نتائج تجريبية على معيار آخر، وهو MUSDB18. ويجدر بالإشارة إلى أن الكود المصدري للنموذج متاح عبر الإنترنت.

KUIELab-MDX-Net: شبكة عصبية ذات تدفقين للتفكيك الموسيقي | أحدث الأوراق البحثية | HyperAI