منذ 2 أشهر
UniCon+: تقديم ICTCAS-UCAS لمهام AVA-ActiveSpeaker في تحدي ActivityNet 2022
Zhang, Yuanhang ; Liang, Susan ; Yang, Shuang ; Shan, Shiguang

الملخص
تقدم هذه الورقة تقريرًا موجزًا عن حلنا الفائز في مهمة اكتشاف المتحدث النشط (AVA Active Speaker Detection - ASD) ضمن تحدي ActivityNet لعام 2022. يستند نموذجنا الأساسي UniCon+ إلى أعمالنا السابقة، وهي شبكة السياق الموحدة (Unified Context Network - UniCon) وUniCon الموسعة، والمصممة لتحقيق أداء قوي في اكتشاف المتحدث النشط على مستوى المشهد. قمنا بتعزيز البنية المعمارية بإضافة وحدة بسيطة تعتمد على GRU تسمح بنقل المعلومات المتعلقة بالهويات المتكررة عبر المشاهد من خلال عمليات القراءة والتحديث. نبلغ عن أفضل نتيجة بلغت 94.47% mAP على مجموعة اختبار AVA-ActiveSpeaker، والتي لا تزال تحتل المركز الأول في جدول الترتيب لهذا العام وتدفع الحالة الحالية للتقنية بشكل كبير.