HyperAIHyperAI
منذ 17 أيام

نمذجة الاستكمال وفصل السياق للتحديد الزمني للإجراءات بتأطير ضعيف

{ Yizhou Wang, Tingting Jiang, Daochang Liu}
نمذجة الاستكمال وفصل السياق للتحديد الزمني للإجراءات بتأطير ضعيف
الملخص

يُعدّ التحديد الزمني للإجراءات أمرًا بالغ الأهمية لفهم مقاطع الفيديو غير المُقَصَّة. في هذه الدراسة، نحدد أولًا مشكلتين غير كافيتين في استكشافهما في سياق التدريب بوساطة ضعيفة للتحديد الزمني للإجراءات، وهما: نمذجة اكتمال الإجراءات، وفصل الإجراءات عن سياقها. ثم، من خلال عرض بنية شبكة جديدة واستراتيجية تدريبها، نتناول هاتين المشكلتين بشكل صريح. بشكل خاص، لتمثيل اكتمال الإجراءات، نقترح شبكة عصبية متعددة الفروع، حيث تُجبر الفروع على اكتشاف أجزاء إجرائية مميزة. وبهذا، يمكن تحديد الإجراءات الكاملة من خلال دمج الإشارات الناتجة عن الفروع المختلفة. أما لفصل إجراءات عن السياق المحيط بها، فإننا نُولِّد بيانات سلبية صعبة للتدريب باستخدام الافتراض القائل إن مقاطع الفيديو الثابتة (غير المتحركة) من غير المرجح أن تكون إجراءات. أظهرت التجارب التي أُجريت على مجموعتي بيانات THUMOS'14 وActivityNet أن إطار عملنا يتفوّق على أحدث الأساليب. وبشكل خاص، تم تحسين متوسط دقة القياس (mAP) على ActivityNet v1.2 من 18.0% إلى 22.4% بشكل ملحوظ. سيتم إصدار الكود الخاص بنا قريبًا.

نمذجة الاستكمال وفصل السياق للتحديد الزمني للإجراءات بتأطير ضعيف | أحدث الأوراق البحثية | HyperAI