HyperAIHyperAI

Command Palette

Search for a command to run...

DeepFilterNet: تحسين الصوت في الزمن الحقيقي مدفوع بالتحسس

Hendrik Schröter Tobias Rosenkranz Alberto N. Escalante-B. Andreas Maier

الملخص

تُتيح الخوارزميات متعددة الإطارات لتحسين الكلام عبر قناة واحدة الاستفادة من الارتباطات القصيرة الأجل داخل إشارة الكلام. وقد تم اقتراح "التصفية العميقة" (Deep Filtering - DF) لتقدير مرشح معقد مباشرة في المجال الترددي، بهدف الاستفادة من هذه الارتباطات. في هذا العمل، نقدم عرضًا تجريبيًا لتحسين الكلام في الوقت الفعلي باستخدام DeepFilterNet. يتمتع DeepFilterNet بكفاءة عالية بفضل استغلال المعرفة في مجال إنتاج الكلام والتمييز السمعي النفسي. يُمكن نموذجنا تحقيق أداء مطابق لأفضل النماذج الحالية في تحسين الكلام، مع تحقيق معامل زمني فعلي (real-time-factor) قدره 0.19 على وحدة معالجة مركزية واحدة (CPU) في حاسوب محمول، باستخدام خيط معالجة واحد. وقد تم نشر الإطار العام (framework) بالإضافة إلى الوزن المُدرَّب مسبقًا بموجب ترخيص مفتوح المصدر.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
DeepFilterNet: تحسين الصوت في الزمن الحقيقي مدفوع بالتحسس | مستندات | HyperAI