HyperAIHyperAI
منذ 17 أيام

تدريب كشف الأحداث الصوتية على مجموعة بيانات غير متجانسة

تدريب كشف الأحداث الصوتية على مجموعة بيانات غير متجانسة
الملخص

تدريب خوارزمية كشف الأحداث الصوتية على مجموعة بيانات غير متجانسة تشمل مناظر صوتية مسجلة وصوتية مُصَنَّعة، والتي قد تختلف في دقة التصنيف، يُعد مهمة غير بسيطة وقد يؤدي إلى أنظمة تتطلب اتخاذ عدة قرارات تقنية. غالبًا ما تُنقل هذه القرارات التقنية من نظام إلى آخر دون أن تُخضع للنقد أو التقييم. نقترح إجراء تحليل مفصل للنظام الأساسي لمهام DCASE 2020 المهمة 4 الخاصة بكشف الأحداث الصوتية، من حيث جوانب متعددة مثل نوع البيانات المستخدمة في التدريب، وبارامترات نموذج المُعلِّم المتوسط (mean-teacher)، والتحويلات المطبقة أثناء إنشاء المناظر الصوتية المُصَنَّعة. وتبين بعض البارامترات التي تُستخدم عادة كقيم افتراضية أنها غير مثالية.

تدريب كشف الأحداث الصوتية على مجموعة بيانات غير متجانسة | أحدث الأوراق البحثية | HyperAI