منذ 9 أيام
نظام مسابقة NTT DCASE2020 المهمة 6: التوصيف الصوتي التلقائي مع تقدير الكلمات المفتاحية وطول الجملة
Yuma Koizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada, Kunio Kashino

الملخص
يُصف في هذا التقرير الفني النظام المشارك في مسابقة كشف وتصنيف المشاهد والأحداث الصوتية (DCASE) 2020، المهمة 6: التسمية التلقائية للصوت. يركّز إرسالنا على حل مشكلتين متعلقتين بالغموض في التسمية التلقائية للصوت: غموض اختيار الكلمات، وغموض طول الجملة. ونحلّ المشكلتين الرئيسيتين في إنشاء التسميات، بالإضافة إلى المشكلات الفرعية المتعلقة بالغموض، من خلال تقدير الكلمات المفتاحية وطول الجملة باستخدام التعلم متعدد المهام. وقد جرّبنا نموذجًا مبسطًا من إرسالنا باستخدام مجموعة بيانات التدريب والاختبار التنموية. وحقّق النموذج درجة SPIDEr قدرها 20.7، مقابل درجة 5.4 للنظام الأساسي.