منذ 16 أيام
التجريب العشوائي للاتساق: تدريب اتساق عشوائي للكشف عن الأحداث الصوتية شبه المُدرَّب
Nian Shao, Erfan Loweimi, Xiaofei Li

الملخص
كشف الأحداث الصوتية (SED)، باعتباره أحد المكونات الأساسية لتحليل البيئة الصوتية، يعاني من مشكلة نقص البيانات. ويُخفّف دمج التعلم شبه المُراقب (SSL) إلى حد كبير من هذه المشكلة دون الحاجة إلى ميزانية إضافية للتصنيف. تبحث هذه الورقة البحثية في عدة مكونات أساسية ضمن SSL، وتقترح استراتيجية تدريب متسقة عشوائيًا (RCT). أولاً، تم اقتراح خسارة اتساق ذاتي للدمج مع نموذج المعلم-الطالب بهدف تثبيت عملية التدريب. ثانيًا، تم اقتراح تقنية تكبير بيانات "مختلط صعب" لمراعاة الخاصية الجمعية للصوتيات. ثالثًا، تم تطبيق خطة تكبير عشوائية لدمج مرن لمختلف أنواع تكبيرات البيانات. أظهرت التجارب أن الاستراتيجية المقترحة تتفوق على استراتيجيات أخرى شائعة الاستخدام.