HyperAIHyperAI

Command Palette

Search for a command to run...

KUIELab-MDX-Net: شبكة عصبية ذات تدفقين للتفكيك الموسيقي

Minseok Kim Woosung Choi Jaehwa Chung Daewon Lee Soonyoung Jung

الملخص

في الآونة الأخيرة، تم اقتراح العديد من الطرق القائمة على التعلم العميق لفصل مصادر الموسيقى. وقد أظهرت بعض الطرق الرائدة في مجالها أن تراكيب طبقات متعددة مع العديد من الاتصالات الجانبية (skip connections) تُحسّن أداء معامل التحسين المطلق للإشارة (SDR). وعلى الرغم من أن مثل هذه البنية العميقة والمعقدة تُظهر أداءً متميزًا، إلا أنها تتطلب عادةً موارد حوسبة كبيرة ووقتًا طويلًا في التدريب والتقييم. تقدم هذه الورقة شبكة عصبية ذات تدفقين (two-stream neural network) لفصل موسيقى مدمجة، تُسمى KUIELab-MDX-Net، والتي تُظهر توازنًا جيدًا بين الأداء والموارد المطلوبة. يحتوي النموذج المقترح على فرع زمني-تكراري وفرع زمني، حيث يقوم كل فرع بفصل الأصوات بشكل منفصل. ثم يتم دمج النتائج الناتجة من الفرعين لإنتاج التقدير النهائي. وقد حصلت KUIELab-MDX-Net على المركز الثاني في قائمة التصنيف A والمركز الثالث في قائمة التصنيف B ضمن مسابقة فصل الموسيقى في مؤتمر ISMIR 2021. كما تُلخّص هذه الورقة نتائج تجريبية على معيار آخر، وهو MUSDB18. ويجدر بالإشارة إلى أن الكود المصدري للنموذج متاح عبر الإنترنت.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp