التحفيز والإصلاح: تقسيم الإجراءات من خلال التمرير التوسعي وإعادة البناء الزمني

تهدف التجزئة الفعلية إلى تقسيم مقاطع الفيديو إلى أجزاء تمثل أفعالًا مختلفة. وتركز الدراسات الحديثة على معالجة الاعتماديات طويلة المدى في مقاطع الفيديو الطويلة وغير المُقَصَّة، لكنها ما زالت تعاني من مشكلة التجزئة الزائدة والأداء الثابت نتيجة زيادة تعقيد النموذج. يعالج هذا البحث المشكلات المذكورة من خلال استراتيجية التقسيم والانتصار، والتي تبدأ بتحقيق أعلى دقة ممكنة في تصنيف الإطارات، ثم تقليل أخطاء التجزئة الزائدة. تُطبَّق هذه الاستراتيجية باستخدام شبكة التمرير والإعادة التكوينية (Dilation Passing and Reconstruction Network)، التي تتألف من شبكة التمرير بالتمدد (Dilation Passing Network)، والتي تهدف بشكل رئيسي إلى تعزيز الدقة من خلال نقل المعلومات عبر تمددات مختلفة، وشبكة إعادة التكوين الزمنية (Temporal Reconstruction Network)، التي تقلل من أخطاء التجزئة الزائدة من خلال ترميز وفك ترميز السمات الزمنية الناتجة عن شبكة التمرير بالتمدد. كما نقترح خسارة متوسط المربعات الزمنية الموزونة، التي تُسهم بشكل إضافي في تقليل التجزئة الزائدة. وبناءً على تقييمات أجريت على مجموعات بيانات 50Salads وGTEA وBreakfast، نُظهر أن نموذجنا يحقق نتائج مميزة مقارنة بالنماذج الرائدة الحالية.