HyperAIHyperAI
منذ 2 أشهر

تعلم تمثيل لتحديد الأغاني المغناة باستخدام الشبكات العصبية المت convoledة

Zhesong Yu; Xiaoshuo Xu; Xiaoou Chen; Deshun Yang
تعلم تمثيل لتحديد الأغاني المغناة باستخدام الشبكات العصبية المت convoledة
الملخص

تُمثِّلُ تحديدُ الأغاني المغطاةِ (الكوفرز) تحديًا معقدًا في مجال استرجاع معلومات الموسيقى (MIR) بسبب التغيرات الموسيقية المعقدة بين المسارات الاستعلامات والأغاني المغطاة. غالبًا ما تعتمد الدراسات السابقة على استخدام الخصائص المصممة يدويًا والخوارزميات المُحاذاة لتحقيق هذه المهمة. مؤخرًا، تم تحقيق تقدم إضافي من خلال استخدام نماذج الشبكات العصبية. في هذا البحث، نقترح هندسةً جديدةً للشبكة العصبية التلافيفية (CNN) تستند إلى خصائص مهمة الأغاني المغطاة. أولاً، نقوم بتدريب الشبكة باستخدام استراتيجيات التصنيف؛ ثم يتم استخدامها لاستخراج تمثيل الموسيقى لتحديد الأغاني المغطاة. تم تصميم مخطط لتدريب النماذج القوية ضد تغييرات الإيقاع. تظهر النتائج التجريبية أن نهجنا يتفوق على أفضل الأساليب الحالية في جميع قواعد البيانات العامة، خاصة في القاعدة الكبيرة من البيانات.

تعلم تمثيل لتحديد الأغاني المغناة باستخدام الشبكات العصبية المت convoledة | أحدث الأوراق البحثية | HyperAI