التدريب المستمر الذاتي مع إعادة خلط مُعزَّز لتحسين الصوت

نُقدّم RemixIT، وهي طريقة تدريب ذاتية بسيطة وحديثة لتحسين الصوت. تعتمد الطريقة المقترحة على نموذج تدريب ذاتي مستمر يتجاوز القيود التي كانت موجودة في الدراسات السابقة، بما في ذلك الافتراضات المتعلقة بتوزيع الضوضاء داخل النطاق (in-domain) والوصول إلى إشارات هدف نظيفة. بشكل محدد، يتم تدريب نموذج "معلم الفصل" مسبقًا على مجموعة بيانات خارج النطاق (out-of-domain)، ثم يستخدم لاستنتاج إشارات هدف مُقدّرة لدفعة من المزجات داخل النطاق. بعد ذلك، نُجري عملية إعادة خلط (bootstrapping) من خلال إنشاء مزجات اصطناعية باستخدام إشارات نظيفة وضوضاء مُعاد ترتيبها (permuted). أخيرًا، يتم تدريب نموذج "الطالب" باستخدام المصادر المُقدّرة المُعاد ترتيبها كأهداف، بينما نُحدّث بشكل دوري أوزان المعلم باستخدام أحدث نموذج للطالب. تُظهر التجارب أن RemixIT تتفوّق على عدة طرق ذاتية التدريب من الدرجة الأولى السابقة في مهام متعددة لتحسين الصوت. علاوةً على ذلك، تُقدّم RemixIT بديلًا سلسًا للتكيف النطاقي شبه المُراقب (semi-supervised) والغير مُراقب (unsupervised) في مهام تحسين الصوت، مع كونها عامة بما يكفي لتطبيقها على أي مهمة فصل، وتُستخدم مع أي نموذج فصل.