HyperAIHyperAI
منذ 17 أيام

خسارة في مجال التحفيز لتحسين الكلام في الوقت الفعلي القائم على الشبكات العصبية

Tyler Vuong, Yangyang Xia, Richard M. Stern
خسارة في مجال التحفيز لتحسين الكلام في الوقت الفعلي القائم على الشبكات العصبية
الملخص

نُقدِّم دالة خسارة في مجال التحفيز (modulation domain) لأنظمة تحسين الكلام القائمة على التعلم العميق. تم تكييف مجالات الاستقبال الطيفية-الزمنية القابلة للتعلم (STRFs) بهدف تحسين أداء مهمة تحديد المتحدث. ثم استُخدمت هذه المجالات المُدرَّبة لحساب متوسط مربع الخطأ (MSE) الموزون في مجال التحفيز، وذلك لتدريب نظام تحسين الكلام. أظهرت التجارب أن إضافة متوسط مربع الخطأ في مجال التحفيز إلى متوسط مربع الخطأ في المجال الطيفي-الزمني قد عزز بشكل كبير التنبؤ الموضوعي بجودة الكلام ووضوحه في الأنظمة الزمنية الحقيقية لتحسين الكلام، دون إحداث أي حمل إضافي على الحوسبة أثناء عملية الاستدلال.

خسارة في مجال التحفيز لتحسين الكلام في الوقت الفعلي القائم على الشبكات العصبية | أحدث الأوراق البحثية | HyperAI