HyperAIHyperAI

Command Palette

Search for a command to run...

CoverHunter: تحديد الأغاني المغطاة باستخدام الانتباه المُعَدَّل والمحاذاة

Feng Liu Yinan Xu Deyi Tuo Xintong Han

الملخص

ملخص: يركز تحديد الأغاني المغطاة (Cover Song Identification - CSI) على العثور على نفس الموسيقى بنسخ مختلفة في نقاط المرجع المعطاة عند استعلام المسار. في هذا البحث، نقترح نظامًا جديدًا باسم CoverHunter يتجاوز عيوب الخطط الكشفية الحالية من خلال استكشاف ميزات أكثر غنى مع انتباه ومحاذاة مُدققة. يتكون CoverHunter من ثلاثة وحدات رئيسية: 1) هيكل متغير مُعزز بالتحويل (أي Conformer) الذي يلتقط التفاعلات بين الميزات المحلية والعالمية على عكس الطرق السابقة التي تعتمد بشكل أساسي على الشبكات العصبية التلافيفية؛ 2) وحدة تجميع زمني قائمة على الانتباه التي تستغل الانتباه بشكل أكبر في البعد الزمني؛ 3) خطة تدريب جديدة من الخشن إلى الدقيق تقوم أولاً بتدريب شبكة لمحاذاة قطع الأغاني بشكل تقريبي ثم تُدقق الشبكة عن طريق التدريب على القطع المحاذاة. وفي الوقت نفسه، نلخص بعض الحيل التدريبية الهامة المستخدمة في نظامنا والتي تساعد في تحقيق نتائج أفضل. أظهرت التجارب على عدة مجموعات بيانات قياسية لـ CSI أن طرقنا تحسن بشكل كبير على الطرق الرائدة حاليًا بمعدل حجم التضمين 128 (2.3% في SHS100K-TEST و17.7% في DaTacos).


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp