HyperAIHyperAI
منذ 17 أيام

MetricGAN-OKD: تحسين متعدد المقاييس لـ MetricGAN من خلال التعلم المعرفي عبر الإنترنت لتحسين الصوت

{Sung Won Han, Hyun Joon Park, Jin Sob Kim, Byung Hoon Lee, WooSeok Shin}
MetricGAN-OKD: تحسين متعدد المقاييس لـ MetricGAN من خلال التعلم المعرفي عبر الإنترنت لتحسين الصوت
الملخص

في تحسين الكلام، تقلل النهج القائمة على MetricGAN الفرق بين خسارة $L_p$ ومقاييس التقييم من خلال استخدام دالة تقييم غير قابلة للتفاضل كدالة هدف. ومع ذلك، يظل تحسين عدة مقاييس في آن واحد تحديًا بسبب مشكلة اتجاهات التدرج المربكة. في هذه الورقة، نقترح طريقة فعّالة لتحسين عدة مقاييس في MetricGAN من خلال التعلم التلقائي للخبير على الإنترنت — MetricGAN-OKD. يتكوّن MetricGAN-OKD من عدة مولّدات ومقاييس مستهدفة، مرتبطة بعلاقة واحدة لواحدة، مما يسمح للمولّدات بتعلم الاستجابة لمؤشر واحد بشكل موثوق، وفي الوقت نفسه تحسين الأداء بالنسبة للمقاييس الأخرى من خلال تقليد المولّدات الأخرى. أظهرت النتائج التجريبية في مهام تحسين الكلام وتحسين تجربة الاستماع أن الطريقة المقترحة تحسن الأداء بشكل ملحوظ من حيث عدة مقاييس مقارنةً بالأساليب الحالية لتحسين المقاييس المتعددة. علاوةً على ذلك، يُفسّر الأداء الجيد لـ MetricGAN-OKD من منظور قدرة الشبكة على التعميم والعلاقة الترابطية بين المقاييس.