إزالة الضوضاء والتأخير الصوتي الفوري ذات المرحلة الواحدة باستخدام U-Net

في هذا العمل، نتناول مشكلة إزالة الضوضاء وإزالة التأثيرات الصوتية المُتكررة باستخدام إطار عمل أحادي المرحلة. وعلى الرغم من أن إزالة الضوضاء وإزالة التأثيرات الصوتية المُتكررة قد يُنظر إليهما على أنهما مهام صعبة منفصلة، وبالتالي يتطلب الأمر عادةً وحدتين منفصلتين لكل مهمة، إلا أننا نُظهر أن شبكة عميقة واحدة يمكن مشاركتها لحل هاتين المشكلتين معًا. ولتحقيق ذلك، نقترح طريقة تمرير جديدة تُسمى "المرشح البيتا-سيغمويد المُدرك للطور" (PHM)، التي تعيد استخدام القيم المقدّرة للحجم لتقدير الطور النقي مع مراعاة متباينة المثلث في الفضاء المركب بين مكونات الإشارة الثلاثة، مثل المزيج، والمصدر، والباقي. ويتم استخدام مرشحين من نوع PHM لمعالجة المصدر المباشر والمؤثر المُتكرر، مما يتيح التحكم بنسب التأثير المُتكرر في الصوت المحسّن أثناء عملية الاستدلال. بالإضافة إلى ذلك، ولتحسين أداء تحسين الصوت، نقترح دالة خسارة جديدة في المجال الزمني، ونُظهر تحقيق تحسن معقول في الأداء مقارنةً بخسارة متوسط المربعات (MSE) في المجال المركب. وأخيرًا، ولتحقيق استدلال في الزمن الفعلي، نقترح استراتيجية تحسين لشبكة U-Net، التي تقلل بشكل كبير من الحمل الحسابي بنسبة تصل إلى 88.9٪ مقارنةً بالإصدار التقليدي.