منذ 17 أيام
تدريب كشف الأحداث الصوتية على مجموعة بيانات غير متجانسة

الملخص
تدريب خوارزمية كشف الأحداث الصوتية على مجموعة بيانات غير متجانسة تشمل مناظر صوتية مسجلة وصوتية مُصَنَّعة، والتي قد تختلف في دقة التصنيف، يُعد مهمة غير بسيطة وقد يؤدي إلى أنظمة تتطلب اتخاذ عدة قرارات تقنية. غالبًا ما تُنقل هذه القرارات التقنية من نظام إلى آخر دون أن تُخضع للنقد أو التقييم. نقترح إجراء تحليل مفصل للنظام الأساسي لمهام DCASE 2020 المهمة 4 الخاصة بكشف الأحداث الصوتية، من حيث جوانب متعددة مثل نوع البيانات المستخدمة في التدريب، وبارامترات نموذج المُعلِّم المتوسط (mean-teacher)، والتحويلات المطبقة أثناء إنشاء المناظر الصوتية المُصَنَّعة. وتبين بعض البارامترات التي تُستخدم عادة كقيم افتراضية أنها غير مثالية.