Command Palette
Search for a command to run...
تعلم تمثيل لتحديد الأغاني المغناة باستخدام الشبكات العصبية المت convoledة
تعلم تمثيل لتحديد الأغاني المغناة باستخدام الشبكات العصبية المت convoledة
Zhesong Yu Xiaoshuo Xu Xiaoou Chen Deshun Yang
الملخص
تُمثِّلُ تحديدُ الأغاني المغطاةِ (الكوفرز) تحديًا معقدًا في مجال استرجاع معلومات الموسيقى (MIR) بسبب التغيرات الموسيقية المعقدة بين المسارات الاستعلامات والأغاني المغطاة. غالبًا ما تعتمد الدراسات السابقة على استخدام الخصائص المصممة يدويًا والخوارزميات المُحاذاة لتحقيق هذه المهمة. مؤخرًا، تم تحقيق تقدم إضافي من خلال استخدام نماذج الشبكات العصبية. في هذا البحث، نقترح هندسةً جديدةً للشبكة العصبية التلافيفية (CNN) تستند إلى خصائص مهمة الأغاني المغطاة. أولاً، نقوم بتدريب الشبكة باستخدام استراتيجيات التصنيف؛ ثم يتم استخدامها لاستخراج تمثيل الموسيقى لتحديد الأغاني المغطاة. تم تصميم مخطط لتدريب النماذج القوية ضد تغييرات الإيقاع. تظهر النتائج التجريبية أن نهجنا يتفوق على أفضل الأساليب الحالية في جميع قواعد البيانات العامة، خاصة في القاعدة الكبيرة من البيانات.