منذ 3 أشهر
إزالة الضوضاء من الصوت في مجال الموجة باستخدام الانتباه الذاتي
Zhifeng Kong, Wei Ping, Ambrish Dantrey, Bryan Catanzaro

الملخص
في هذه الدراسة، نقدّم نموذج CleanUNet، وهو نموذج لتنقية الكلام السببي يعمل مباشرة على الموجة الخام. يعتمد النموذج المقترح على بنية مشفرة-فكّر مشتركة مع عدة كتل انتباه ذاتي لتحسين تمثيلاته في منطقة التضييق، وهي خطوة بالغة الأهمية لتحقيق نتائج متميزة. تم تحسين النموذج باستخدام مجموعة من دوال الخسارة المحددة على كل من الموجة الخام وتمثيلات الطيف متعددة الدقة. وقد أظهر الأداء المُقدّم تفوقًا على النماذج الحالية في مجال جودة الكلام المنقّى، من خلال مجموعة من مقاييس التقييم الموضوعية والذاتية. ونُشر الكود والنماذج الخاصة بنا على الرابط التالي: https://github.com/nvidia/cleanunet.