HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 4 أشهر

ASQuery: نموذج يعتمد على الاستعلام لتقسيم الإجراءات

{Zhao Jian Xing Junliang Li Jianshu Wang Zhecan Li Liang Li Zhou Zheng Wang Nie Lei Jin Lei Gan Ziliang}

الملخص

بالنسبة لمهمة تقسيم الأفعال الزمنية، يُعالج معظم الأعمال الحالية هذه المهمة على أنها مشكلة تصنيف على مستوى الإطارات. في هذه الورقة، نقترح نموذجًا مباشرًا ولكن فعّالًا يُسمى ASQuery، من خلال تعلّم تمثيل مركزي لكل فئة من فئات الأفعال، مما يحوّل مشكلة التصنيف إلى عملية حساب التشابه بين استفسارات محددة بالفئات وسمات الإطارات. يتم إنشاء هذه التمثيلات المركزية ديناميكيًا من خلال وحدة فك التشفير الخاصة بنا بناءً على نموذج المُحَوِّل (Transformer)، مما يمنحها مرونة وأكثر شمولاً في فهم الفيديو بأكمله. علاوةً على ذلك، نُقدّم لأول مرة مفهوم "استفسار الحدود" (boundary query) لتحسين نتائج التقسيم، مما يسهم في تقليل مشكلة التقسيم الزائد (over-segmentation) المُزعجة. تُظهر نتائج ASQuery أداءً متفوّقًا مقارنةً بالنماذج الحالية الأفضل، حيث حققت تحسينات بنسبة 0.9% و4.1% في المتوسط على معيار الأداء على مجموعتي بيانات عامة للتقسيم الفعلي، وهما Breakfast وAssembly101 على التوالي. تتوفر الشيفرة المصدرية على الرابط التالي: https://github.com/zlngan/ASQuery.

المعايير القياسية

معيار قياسيالمنهجيةالمقاييس
action-segmentation-on-assembly101ASQuery
Edit: 35.3
F1@10%: 37.8
F1@25%: 35.6
F1@50%: 29.4
MoF: 40.4
action-segmentation-on-breakfast-1ASQuery
Acc: 77.9
Average F1: 74.6
Edit: 78.4
F1@10%: 80.7
F1@25%: 76.5
F1@50%: 66.5

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
ASQuery: نموذج يعتمد على الاستعلام لتقسيم الإجراءات | الأوراق البحثية | HyperAI