HyperAIHyperAI
منذ 2 أشهر

CoverHunter: تحديد الأغاني المغطاة باستخدام الانتباه المُعَدَّل والمحاذاة

Feng Liu; Deyi Tuo; Yinan Xu; Xintong Han
CoverHunter: تحديد الأغاني المغطاة باستخدام الانتباه المُعَدَّل والمحاذاة
الملخص

ملخص: يركز تحديد الأغاني المغطاة (Cover Song Identification - CSI) على العثور على نفس الموسيقى بنسخ مختلفة في نقاط المرجع المعطاة عند استعلام المسار. في هذا البحث، نقترح نظامًا جديدًا باسم CoverHunter يتجاوز عيوب الخطط الكشفية الحالية من خلال استكشاف ميزات أكثر غنى مع انتباه ومحاذاة مُدققة. يتكون CoverHunter من ثلاثة وحدات رئيسية: 1) هيكل متغير مُعزز بالتحويل (أي Conformer) الذي يلتقط التفاعلات بين الميزات المحلية والعالمية على عكس الطرق السابقة التي تعتمد بشكل أساسي على الشبكات العصبية التلافيفية؛ 2) وحدة تجميع زمني قائمة على الانتباه التي تستغل الانتباه بشكل أكبر في البعد الزمني؛ 3) خطة تدريب جديدة من الخشن إلى الدقيق تقوم أولاً بتدريب شبكة لمحاذاة قطع الأغاني بشكل تقريبي ثم تُدقق الشبكة عن طريق التدريب على القطع المحاذاة. وفي الوقت نفسه، نلخص بعض الحيل التدريبية الهامة المستخدمة في نظامنا والتي تساعد في تحقيق نتائج أفضل. أظهرت التجارب على عدة مجموعات بيانات قياسية لـ CSI أن طرقنا تحسن بشكل كبير على الطرق الرائدة حاليًا بمعدل حجم التضمين 128 (2.3% في SHS100K-TEST و17.7% في DaTacos).

CoverHunter: تحديد الأغاني المغطاة باستخدام الانتباه المُعَدَّل والمحاذاة | أحدث الأوراق البحثية | HyperAI