منذ 17 أيام
خسارة في مجال التحفيز لتحسين الكلام في الوقت الفعلي القائم على الشبكات العصبية
Tyler Vuong, Yangyang Xia, Richard M. Stern

الملخص
نُقدِّم دالة خسارة في مجال التحفيز (modulation domain) لأنظمة تحسين الكلام القائمة على التعلم العميق. تم تكييف مجالات الاستقبال الطيفية-الزمنية القابلة للتعلم (STRFs) بهدف تحسين أداء مهمة تحديد المتحدث. ثم استُخدمت هذه المجالات المُدرَّبة لحساب متوسط مربع الخطأ (MSE) الموزون في مجال التحفيز، وذلك لتدريب نظام تحسين الكلام. أظهرت التجارب أن إضافة متوسط مربع الخطأ في مجال التحفيز إلى متوسط مربع الخطأ في المجال الطيفي-الزمني قد عزز بشكل كبير التنبؤ الموضوعي بجودة الكلام ووضوحه في الأنظمة الزمنية الحقيقية لتحسين الكلام، دون إحداث أي حمل إضافي على الحوسبة أثناء عملية الاستدلال.