HyperAIHyperAI
منذ 11 أيام

TemporalMaxer: تحسين السياق الزمني باستخدام التجميع الأقصى فقط لتحديد الإجراءات الزمنية

Tuan N. Tang, Kwonyoung Kim, Kwanghoon Sohn
TemporalMaxer: تحسين السياق الزمني باستخدام التجميع الأقصى فقط لتحديد الإجراءات الزمنية
الملخص

تُعدّ مهمة تحديد الحدث الزمني (TAL) مهمة صعبة في فهم الفيديو، وتهدف إلى تحديد وتوصيف الأحداث داخل تسلسل فيديو. وقد ركّزت الدراسات الحديثة على أهمية تطبيق كتل نمذجة السياق الزمني الطويل (TCM) على السمات المستخرجة من مقاطع الفيديو، مثل استخدام آليات الانتباه الذاتي المعقدة. في هذه الورقة، نقدّم أبسط طريقة تم اقتراحها حتى الآن لمعالجة هذه المهمة، ونُجادل بأن السمات المستخرجة من مقاطع الفيديو كافية بالفعل لتحقيق أداء متميز دون الحاجة إلى هياكل معقدة. ولتحقيق ذلك، نُقدّم "TemporalMaxer"، الذي يقلل من نمذجة السياق الزمني الطويل بينما يُعزّز المعلومات المستخرجة من سمات مقاطع الفيديو باستخدام كتلة بسيطة وغير مُعلّمة وتعمل على مناطق محلية من نوع max-pooling. حيث تُستخرج فقط المعلومات الأكثر أهمية لسمايات المقاطع المجاورة والمحليّة، مما يؤدي إلى نموذج TAL أكثر كفاءة. ونُظهر أن "TemporalMaxer" يتفوّق على الطرق الرائدة الأخرى التي تستخدم نمذجة السياق الزمني الطويل مثل الانتباه الذاتي على مجموعة متنوعة من مجموعات بيانات TAL، مع استهلاك عدد أقل بكثير من المعاملات والموارد الحاسوبية. ويتوفر الكود الخاص بنا بشكل عام على الرابط التالي: https://github.com/TuanTNG/TemporalMaxer

TemporalMaxer: تحسين السياق الزمني باستخدام التجميع الأقصى فقط لتحديد الإجراءات الزمنية | أحدث الأوراق البحثية | HyperAI