اكتشاف الأحداث في مقاطع الفيديو الرياضية المُشَرَّحَة بخُشُونٍ عبر الالتفافات المتوازية ذات الحقول الاستقبالية المتعددة البُعد الواحد

في مشاكل مثل تحليل مقاطع الفيديو الرياضية، من الصعب الحصول علىالشروحات الدقيقة على مستوى الإطارات ومدة الأحداث بدقة بسبب طول مقاطع الفيديووكثرة بيانات الفيديو. هذا الأمر يصبح أكثر وضوحًا في الرياضات السريعة الوتيرة مثل الهوكي الجليدي.يمكن أن يكون الحصول على شروحات على نطاق خشن (Coarse) أكثر عملية وكفاءة من حيث الوقت.نقترح مهمة كشف الأحداث في مقاطع الفيديو المشرحة بشكل خشن (Coarsely Annotated).نقدم معمارية شبكة تلافيفية زمنية متعددة الأبراج (Multi-Tower Temporal Convolutional Network)للarefa المقترحة. تقوم الشبكة بمعالجة المعلومات بمعدلات زمنية مختلفة بمساعدة حقول استقبال متعددةللحساب عدم اليقين فيما يتعلق بموقع ومدة الحدث الدقيقين. نثبت فعالية معمارية الحقول الاستقبالية المتعددةمن خلال دراسات تقليص مناسبة (Ablation Studies). يتم تقييم الطريقة في مهمتين -كشف الأحداث في مقاطع الفيديو الخشنة للهوكي الجليدي في مجموعة بيانات الدوري الوطني لكرة الهوكي (NHL)وكشف الأحداث في كرة القدم في مجموعة بيانات SoccerNet. تعاني المجموعتان من البيانات من نقص الشروحات على مستوى الإطاراتوتتميزان بتكرار أحداث مختلف تمامًا. تظهر النتائج التجريبية فعالية الشبكة من خلال تحقيق معدل F1 المتوسط بنسبة 55٪على مجموعة بيانات الدوري الوطني لكرة الهوكي (NHL) وبأداء تنافسي مقارنة بأحدث التقنيات على مجموعة بيانات SoccerNet.نعتقد أن نهجنا سيساعد في تطوير خطوط إنتاج أكثر عملية لكشف الأحداث في مقاطع الفيديو الرياضية.