HyperAIHyperAI
منذ 17 أيام

كشف الأحداث الصوتية في البيئات المنزلية باستخدام بيانات مُلصَّقة بشكل ضعيف وتركيب المشهد الصوتي

{Justin Salamon, Ankit Shah, Romain Serizel, Nicolas Turpault}
كشف الأحداث الصوتية في البيئات المنزلية باستخدام بيانات مُلصَّقة بشكل ضعيف وتركيب المشهد الصوتي
الملخص

تقدم هذه الورقة المقالة المهمة رقم 4 ضمن تحدي كشف وتصنيف المشاهد والأحداث الصوتية (DCASE) لعام 2019، وتوفر تحليلًا أوليًا لنتائج التحدي. يُعدّ هذا المهمة تابعًا للمهمة رقم 4 في تحدي DCASE لعام 2018، ويتمحور حول تدريب أنظمة للكشف على نطاق واسع عن الأحداث الصوتية باستخدام مزيج من بيانات مُسَمّاة بشكل ضعيف، أي بيانات التدريب التي لا تحتوي على حدود زمنية، بالإضافة إلى بيانات مُصَنَّعة مُسَمّاة بشكل قوي. وتُقدّم الورقة مُجموعة بيانات تُعرف باسم DESED (كشف الأحداث الصوتية في البيئة المنزلية)، والتي تدمج جزءًا من مجموعة البيانات المستخدمة العام الماضي مع مجموعة بيانات مُصَنَّعة إضافية ومُسَمّاة بشكل قوي، والتي تم توفيرها هذا العام، وسنُفصّل وصفها بشكل أكثر تفصيلًا لاحقًا. كما نُقدّم أداء الأنظمة المقدمة على مجموعات التقييم الرسمية (الاختبار) ومجموعات التطوير، بالإضافة إلى عدة مجموعات بيانات إضافية. وقد تفوقت أفضل الأنظمة المقدمة هذا العام على النظام الفائز في العام الماضي بحوالي 10 نقاط مئوية من حيث مقياس F-measure.

كشف الأحداث الصوتية في البيئات المنزلية باستخدام بيانات مُلصَّقة بشكل ضعيف وتركيب المشهد الصوتي | أحدث الأوراق البحثية | HyperAI