التعرف الدقيق والقابل للتوسع على الإصدارات باستخدام التضمينات الموسيقية

تتعامل مهمة تحديد الإصدار (VI) مع الكشف التلقائي عن التسجيلات التي تتوافق مع نفس القطعة الموسيقية الأساسية. على الرغم من الجهود الكثيرة، لا تزال هذه المهمة مشكلة مفتوحة، وتوجد فرص كبيرة للتحسين، خاصة فيما يتعلق بدمج الدقة والقابلية للتوسع. في هذا البحث، نقدم MOVE، وهي طريقة محفزة موسيقيًا لتحديد الإصدار بدقة وقابلية للتوسع. يحقق MOVE أداءً رائدًا في فئته على مجموعتين قياسيتين متاحتين للجمهور من خلال تعلم تمثيلات قابلة للتوسع في فضاء المسافة الأقليدية باستخدام خسارة الثلاثيات واستراتيجية التنقيب عن الثلاثيات الصعبة. يتفوق على الأعمال السابقة من خلال استخدام تمثيل مدخل بديل وتقديم تقنية جديدة لتلخيص المحتوى الزمني، ومجال كامن معياري واستراتيجية زيادة البيانات المصممة خصيصًا لـ VI. بالإضافة إلى النتائج الرئيسية، نقوم بدراستين استبعاديتيْن لتسليط الضوء على أهمية اختياراتنا في التصميم، ودراسة العلاقة بين بعد التمثيل والآداء النموذجي.