شبكة اتفاق ثنائي التدفق للتحديد الزمني للإجراءات بمساعدة ضعيفة

يهدف التوصيف الزمني للإجراءات الضعيف المُراقب (W-TAL) إلى تصنيف وتحديد جميع حالات الإجراء في فيديو غير مُقَصَّر، وذلك باستخدام فقط توجيهًا على مستوى الفيديو. ومع ذلك، وبسبب غياب التسميات على مستوى الإطارات، يُعد من الصعب على طرق W-TAL تحديد الاقتراحات الإجرائية الكاذبة وتكوين اقتراحات إجرائية ذات حدود زمنية دقيقة. في هذا البحث، نقدّم شبكة تجميع ثنائية التدفق (TSCN) لمعالجة هذين التحديين في آنٍ واحد. تتميز TSCN المقترحة بطريقة تدريب منقّحة تكراريًا، حيث يتم تحديث التربة الحقيقية الافتراضية على مستوى الإطار بشكل تكراري، وتُستخدم لتوفير توجيه على مستوى الإطار لتحسين تدريب النموذج وإزالة الاقتراحات الكاذبة. علاوةً على ذلك، نقترح خسارة تطبيع انتباه جديدة لتشجيع الانتباه المُتوقع على أن يعمل كاختيار ثنائي، مما يعزز تحديد حدود حالات الإجراء بدقة. أظهرت التجارب التي أُجريت على مجموعتي بيانات THUMOS14 وActivityNet أن TSCN المقترحة تتفوق على أحدث الطرق المُعلَّمة بشكل كامل، وتحقيق نتائج مماثلة لبعض الطرق المُعلَّمة بشكل كامل الحديثة.