HyperAIHyperAI

Command Palette

Search for a command to run...

تقييم نماذج التصنيف الموسيقي الآلي القائمة على CNN

Minz Won Andres Ferraro Dmitry Bogdanov Xavier Serra

الملخص

التطورات الحديثة في التعلم العميق ساهمت في تسريع تطوير أنظمة التسمية الموسيقية التلقائية القائمة على المحتوى. اقترح باحثو استرجاع معلومات الموسيقى (MIR) تصاميم مختلفة للهياكل، وتعتمد بشكل أساسي على شبكات العصبونات المتلافهة (CNNs)، والتي حققت نتائجًا رائدة في هذه المهمة ذات التصنيف الثنائي متعدد العلامات. ومع ذلك، بسبب الاختلافات في الإعدادات التجريبية التي يتبعها الباحثون، مثل استخدام تقسيمات بيانات مختلفة وأصدارات برامج مختلفة للتقييم، يصعب مقارنة الهياكل المقترحة مباشرة مع بعضها البعض. لتسهيل البحث المستقبلي، أجرينا في هذا البحث تقييمًا متسقًا لعدة نماذج لتسمية الموسيقى على ثلاث قواعد بيانات (MagnaTagATune، Million Song Dataset، و MTG-Jamendo) وقدمنا نتائج مرجعية باستخدام مقاييس تقييم مشتركة (ROC-AUC و PR-AUC). بالإضافة إلى ذلك، تم تقييم جميع النماذج باستخدام مدخلات مشوهة للتحقيق في قدراتها على التعميم فيما يتعلق بتمدد الزمن (time stretch)، تحويل النغمة (pitch shift)، ضغط نطاق الديناميكي (dynamic range compression)، وإضافة الضوضاء البيضاء (white noise). من أجل إمكانية إعادة إنتاج النتائج، قمنا بتوفير تنفيذات PyTorch مع النماذج المدربة مسبقًا.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
تقييم نماذج التصنيف الموسيقي الآلي القائمة على CNN | مستندات | HyperAI