HyperAIHyperAI

Command Palette

Search for a command to run...

TemporalMaxer: تحسين السياق الزمني باستخدام التجميع الأقصى فقط لتحديد الإجراءات الزمنية

Tuan N. Tang Kwonyoung Kim Kwanghoon Sohn

الملخص

تُعدّ مهمة تحديد الحدث الزمني (TAL) مهمة صعبة في فهم الفيديو، وتهدف إلى تحديد وتوصيف الأحداث داخل تسلسل فيديو. وقد ركّزت الدراسات الحديثة على أهمية تطبيق كتل نمذجة السياق الزمني الطويل (TCM) على السمات المستخرجة من مقاطع الفيديو، مثل استخدام آليات الانتباه الذاتي المعقدة. في هذه الورقة، نقدّم أبسط طريقة تم اقتراحها حتى الآن لمعالجة هذه المهمة، ونُجادل بأن السمات المستخرجة من مقاطع الفيديو كافية بالفعل لتحقيق أداء متميز دون الحاجة إلى هياكل معقدة. ولتحقيق ذلك، نُقدّم "TemporalMaxer"، الذي يقلل من نمذجة السياق الزمني الطويل بينما يُعزّز المعلومات المستخرجة من سمات مقاطع الفيديو باستخدام كتلة بسيطة وغير مُعلّمة وتعمل على مناطق محلية من نوع max-pooling. حيث تُستخرج فقط المعلومات الأكثر أهمية لسمايات المقاطع المجاورة والمحليّة، مما يؤدي إلى نموذج TAL أكثر كفاءة. ونُظهر أن "TemporalMaxer" يتفوّق على الطرق الرائدة الأخرى التي تستخدم نمذجة السياق الزمني الطويل مثل الانتباه الذاتي على مجموعة متنوعة من مجموعات بيانات TAL، مع استهلاك عدد أقل بكثير من المعاملات والموارد الحاسوبية. ويتوفر الكود الخاص بنا بشكل عام على الرابط التالي: https://github.com/TuanTNG/TemporalMaxer


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp