حول تعميم المرشحات لتوسيع نطاق التردد الموسيقي باستخدام الشبكات العصبية العميقة

في هذا البحث، نتناول موضوعًا فرعيًا من المجال الواسع لتحسين الصوت، ألا وهو توسيع نطاق التردد الصوتي الموسيقي. نصيغ مشكلة توسيع النطاق باستخدام الشبكات العصبية العميقة، حيث يتم تقديم إشارة ذات نطاق ترددي محدود كمدخل للشبكة، والهدف هو إعادة بناء إخراج ذو نطاق ترددي كامل. يركز إسهامنا الرئيسي على تأثير اختيار المرشح المنخفض التردد عند تدريب الشبكة واختبارها لاحقًا. بالنسبة لعمارتين عصريتين مختلفتين للشبكات العصبية العميقة، ResNet وU-Net، نثبت أن عندما تكون المرشحات المستخدمة في التدريب والاختبار متطابقة، يمكن الحصول على تحسينات في نسبة الإشارة إلى الضوضاء (SNR) تصل إلى 7 ديسيبل. ومع ذلك، عندما تختلف هذه المرشحات، تنخفض التحسينات بشكل كبير وفي بعض ظروف التدريب قد تكون نسبة الإشارة إلى الضوضاء أقل من الإشارة ذات النطاق الترددي المحدود. لتجاوز هذا الالتصاق الظاهري بشكل المرشح، نقترح استراتيجية تعزيز البيانات التي تستفيد من استخدام عدة مرشحات منخفضة التردد أثناء التدريب وتؤدي إلى تحسن في التعميم لظروف الفلترة غير المعروفة عند الاختبار.