الدروس الصوتية كمعلمين لتصنيف الموسيقى

تصنيف الموسيقى كان من أكثر المهام شعبية في مجال استرجاع معلومات الموسيقى. مع تطور نماذج التعلم العميق، شهد العقد الأخير تحسينات ملحوظة في مجموعة واسعة من مهام التصنيف. ومع ذلك، فإن زيادة تعقيد النماذج يجعل التدريب والاستدلال حسابيًا باهظ الثمن. في هذا البحث، ندمج أفكار التعلم النقل (transfer learning) والتقطير المعرفي القائم على الخصائص (feature-based knowledge distillation) ونقوم بدراسة منهجية لاستخدام تمثيلات الصوت المدربة مسبقًا كمعلمين لإرشاد تدريب شبكات الطالب ذات التعقيد المنخفض. من خلال تنظيم فضاء الخصائص للشبكات الطالبة باستخدام التمثيلات المدربة مسبقًا، يمكن نقل المعرفة الموجودة في التمثيلات المعلمة إلى الشبكات الطالبة. نستخدم مجموعة متنوعة من تمثيلات الصوت المدربة مسبقًا ونختبر فعالية الطريقة في مهام تصنيف الآلات الموسيقية وتسمية الموسيقى تلقائيًا. أظهرت النتائج أن طريقتنا تحسن النتائج بشكل كبير بالمقارنة مع النموذج نفسه الذي تم تدريبه دون معرفة المعلم. يمكن أيضًا دمج هذه التقنية مع أساليب التقطير المعرفي الكلاسيكية لتحسين أداء النموذج بشكل أكبر.