HyperAIHyperAI
منذ 2 أشهر

DeFT-AN: شبكة كثيفة للانتباه في التردد والزمن لتحسين الكلام متعدد القنوات

Dongheon Lee; Jung-Woo Choi
DeFT-AN: شبكة كثيفة للانتباه في التردد والزمن لتحسين الكلام متعدد القنوات
الملخص

في هذه الدراسة، نقترح شبكة كثيفة للانتباه في المجال الزمني-الترددي (DeFT-AN) لتحسين الكلام متعدد القنوات. تُعد DeFT-AN شبكة تقدير الأقنعة التي تتوقع نمطًا تردديًا معقدًا للأقنعة لقمع الضوضاء والصدى المدمجين في تحويل فورييه الزمني القصير (STFT) لإشارة الإدخال. تتضمن الشبكة المقترحة ثلاثة أنواع مختلفة من الكتل لتجميع المعلومات في الأبعاد المكانية والترددية والزمنية. تستفيد من محول ترددي مع شبكة تغذية قدام مُعدَّلة ومحول زمني مع convolesions متمددة متتابعة. استخدام الكتل الكثيفة والمحولات المكرسة للخصائص الثلاثة المختلفة للإشارات الصوتية يمكّن من تحسين شامل أكثر في البيئات الضوضائية والصدى. يتم إظهار الأداء المتميز لـ DeFT-AN مقارنة بأحدث النماذج متعددة القنوات بناءً على مجموعتين شهيرتين من البيانات الضوضائية والصدى فيما يتعلق بمجموعة متنوعة من مقاييس جودة الكلام وفهوميته.注释:- "convolesions" 应为 "convolutions" 的拼写错误,因此在翻译中进行了修正。- 为了保持专业性和准确性,一些专有名词如 "DeFT-AN" 和 "STFT" 保留了英文原名。

DeFT-AN: شبكة كثيفة للانتباه في التردد والزمن لتحسين الكلام متعدد القنوات | أحدث الأوراق البحثية | HyperAI