HyperAIHyperAI
منذ 17 أيام

DeepFilterNet: تحسين الصوت في الزمن الحقيقي مدفوع بالتحسس

Hendrik Schröter, Tobias Rosenkranz, Alberto N. Escalante-B., Andreas Maier
DeepFilterNet: تحسين الصوت في الزمن الحقيقي مدفوع بالتحسس
الملخص

تُتيح الخوارزميات متعددة الإطارات لتحسين الكلام عبر قناة واحدة الاستفادة من الارتباطات القصيرة الأجل داخل إشارة الكلام. وقد تم اقتراح "التصفية العميقة" (Deep Filtering - DF) لتقدير مرشح معقد مباشرة في المجال الترددي، بهدف الاستفادة من هذه الارتباطات. في هذا العمل، نقدم عرضًا تجريبيًا لتحسين الكلام في الوقت الفعلي باستخدام DeepFilterNet. يتمتع DeepFilterNet بكفاءة عالية بفضل استغلال المعرفة في مجال إنتاج الكلام والتمييز السمعي النفسي. يُمكن نموذجنا تحقيق أداء مطابق لأفضل النماذج الحالية في تحسين الكلام، مع تحقيق معامل زمني فعلي (real-time-factor) قدره 0.19 على وحدة معالجة مركزية واحدة (CPU) في حاسوب محمول، باستخدام خيط معالجة واحد. وقد تم نشر الإطار العام (framework) بالإضافة إلى الوزن المُدرَّب مسبقًا بموجب ترخيص مفتوح المصدر.