HyperAIHyperAI
منذ 2 أشهر

UniCon+: تقديم ICTCAS-UCAS لمهام AVA-ActiveSpeaker في تحدي ActivityNet 2022

Zhang, Yuanhang ; Liang, Susan ; Yang, Shuang ; Shan, Shiguang
UniCon+: تقديم ICTCAS-UCAS لمهام AVA-ActiveSpeaker في تحدي ActivityNet 2022
الملخص

تقدم هذه الورقة تقريرًا موجزًا عن حلنا الفائز في مهمة اكتشاف المتحدث النشط (AVA Active Speaker Detection - ASD) ضمن تحدي ActivityNet لعام 2022. يستند نموذجنا الأساسي UniCon+ إلى أعمالنا السابقة، وهي شبكة السياق الموحدة (Unified Context Network - UniCon) وUniCon الموسعة، والمصممة لتحقيق أداء قوي في اكتشاف المتحدث النشط على مستوى المشهد. قمنا بتعزيز البنية المعمارية بإضافة وحدة بسيطة تعتمد على GRU تسمح بنقل المعلومات المتعلقة بالهويات المتكررة عبر المشاهد من خلال عمليات القراءة والتحديث. نبلغ عن أفضل نتيجة بلغت 94.47% mAP على مجموعة اختبار AVA-ActiveSpeaker، والتي لا تزال تحتل المركز الأول في جدول الترتيب لهذا العام وتدفع الحالة الحالية للتقنية بشكل كبير.

UniCon+: تقديم ICTCAS-UCAS لمهام AVA-ActiveSpeaker في تحدي ActivityNet 2022 | أحدث الأوراق البحثية | HyperAI