HyperAIHyperAI

Command Palette

Search for a command to run...

إزالة الضوضاء والتأخير الصوتي الفوري ذات المرحلة الواحدة باستخدام U-Net

Hyeong-Seok Choi Hoon Heo Jie Hwan Lee Kyogu Lee

الملخص

في هذا العمل، نتناول مشكلة إزالة الضوضاء وإزالة التأثيرات الصوتية المُتكررة باستخدام إطار عمل أحادي المرحلة. وعلى الرغم من أن إزالة الضوضاء وإزالة التأثيرات الصوتية المُتكررة قد يُنظر إليهما على أنهما مهام صعبة منفصلة، وبالتالي يتطلب الأمر عادةً وحدتين منفصلتين لكل مهمة، إلا أننا نُظهر أن شبكة عميقة واحدة يمكن مشاركتها لحل هاتين المشكلتين معًا. ولتحقيق ذلك، نقترح طريقة تمرير جديدة تُسمى "المرشح البيتا-سيغمويد المُدرك للطور" (PHM)، التي تعيد استخدام القيم المقدّرة للحجم لتقدير الطور النقي مع مراعاة متباينة المثلث في الفضاء المركب بين مكونات الإشارة الثلاثة، مثل المزيج، والمصدر، والباقي. ويتم استخدام مرشحين من نوع PHM لمعالجة المصدر المباشر والمؤثر المُتكرر، مما يتيح التحكم بنسب التأثير المُتكرر في الصوت المحسّن أثناء عملية الاستدلال. بالإضافة إلى ذلك، ولتحسين أداء تحسين الصوت، نقترح دالة خسارة جديدة في المجال الزمني، ونُظهر تحقيق تحسن معقول في الأداء مقارنةً بخسارة متوسط المربعات (MSE) في المجال المركب. وأخيرًا، ولتحقيق استدلال في الزمن الفعلي، نقترح استراتيجية تحسين لشبكة U-Net، التي تقلل بشكل كبير من الحمل الحسابي بنسبة تصل إلى 88.9٪ مقارنةً بالإصدار التقليدي.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp