منذ 12 أيام
تقديم ICTCAS-UCAS-TAL إلى مهمة AVA-ActiveSpeaker في مسابقة ActivityNet Challenge 2021
{Shiguang Shan, Zhongqin Wu, Xiao Liu, Shuang Yang, Susan Liang, Yuanhang Zhang}

الملخص
يقدّم هذا التقرير وصفًا موجزًا لطريقة عملنا في مهمة الكشف عن المتكلم النشط (ASD) في مجموعة AVA ضمن مسابقة ActivityNet 2021. تعتمد حلولنا، المُسمّاة شبكة السياق الموحّدة الموسّعة (Extended UniCon)، على شبكة سياق موحّدة جديدة (UniCon) صُمّمت للكشف القوي عن المتكلم النشط، حيث تدمج مختلف أنواع المعلومات السياقية لتحسين جميع المرشّحين معًا في آنٍ واحد. وقد قمنا بإجراء بعض التغييرات على النموذج الأصلي لـ UniCon من حيث ميزات الصوت، وبنية نمذجة الزمن، وتصميم دالة الخسارة. وبشكل جماعي، يُشكّل أفضل تجميع لنموذجنا حالة متقدمة جديدة بتحقيق دقة متوسطة مُحسّنة (mAP) بلغت 93.4% على مجموعة اختبار AVA-ActiveSpeaker دون استخدام أي شكل من أشكال التدريب المسبق، ويتربع حاليًا على الصدارة في قائمة الترتيب الخاصة بمسابقة ActivityNet.