HyperAIHyperAI
منذ 11 أيام

أين يلتقي الهيكل القوي مع الميزات القوية — ActionFormer لتحدي استفسارات اللحظة في Ego4D

Fangzhou Mu, Sicheng Mo, Gillian Wang, Yin Li
أين يلتقي الهيكل القوي مع الميزات القوية — ActionFormer لتحدي استفسارات اللحظة في Ego4D
الملخص

يصف هذا التقرير مشاركتنا في مسابقة Ego4D Moment Queries Challenge 2022. تعتمد مشاركتنا على نموذج ActionFormer، وهو النموذج الرائد في مجال تحديد الأفعال الزمنية، إلى جانب ثلاث ميزات فيديو قوية مستمدة من نماذج SlowFast وOmnivore وEgoVLP. وحلّلنا في المرتبة الثانية على قائمة التصنيف العامة، بتحقيق متوسط دقة تصل إلى 21.76% (mAP) على مجموعة الاختبار، وهو ما يقارب الثلاث أضعاف مستوى الأداء الخاص بالنموذج الأساسي الرسمي. علاوة على ذلك، حققنا نسبة استرجاع قدرها 42.54% عند tIoU = 0.5 ونسبة 1x على مجموعة الاختبار، متفوّقين على الحل الأول بفارق كبير يبلغ 1.41 نقطة مئوية مطلقة. يُمكن الاطلاع على الكود الخاص بنا عبر الرابط التالي: https://github.com/happyharrycn/actionformer_release.

أين يلتقي الهيكل القوي مع الميزات القوية — ActionFormer لتحدي استفسارات اللحظة في Ego4D | أحدث الأوراق البحثية | HyperAI