تخفيف أخطاء التقسيم الزائد من خلال كشف حدود الإجراء

نُقدّم إطارًا فعّالًا للمهمة المتعلقة بتقسيم الأفعال الزمنية، يُسمّى إطار تحسين مقاطع الفعل (ASRF). يتكون بنية نموذجنا من مستخرج ميزات طويل المدى وفرعين: الفرع الخاص بتقسيم الأفعال (ASB) وفرع الانحدار الحدودي (BRB). يوفّر مستخرج الميزات طويل المدى ميزات مشتركة للفرعين بفضل مجال استقبال زمني واسع. يصنف فرع تقسيم الأفعال (ASB) إطارات الفيديو إلى فئات أفعال، بينما يقوم فرع الانحدار الحدودي (BRB) بانحدار احتمالات حدود الأفعال. تُحسّن الحدود الفعلية المُقدّرة بواسطة فرع الانحدار الحدودي (BRB) الناتج الناتج عن فرع تقسيم الأفعال (ASB)، مما يؤدي إلى تحسين كبير في الأداء. تمثل مساهماتنا الثلاثة ما يلي: (1) نقترح إطارًا لتقسيم الأفعال الزمنية، وهو ASRF، الذي يقسّم مهمة التقسيم الزمني للأفعال إلى تصنيف إطارات الفيديو حسب الفئات الفعلية وانحدار حدود الأفعال. يُحسّن إطارنا الفرضيات على مستوى الإطار من حيث فئات الأفعال باستخدام الحدود الفعلية المُقدّرة. (2) نقترح دالة خسارة لتنعيم انتقال احتمالات الأفعال، ونحلّل مزيجًا من دوال الخسارة المختلفة المُستخدمة في تقسيم الأفعال الزمنية. (3) يتفوّق إطارنا على أحدث الطرق المُقدّمة على ثلاث مجموعات بيانات صعبة، مع تحقيق تحسين يصل إلى 13.7٪ من حيث مسافة التحرير المقاطعية، وصولاً إلى 16.1٪ من حيث دقة F1 المقاطعية. سيتم إتاحة رمز البرنامج الخاص بنا للجمهور قريبًا.