التحديد الزمني للإجراءات على مستوى النقطة: جسر بين الاقتراحات المدعومة بشكل كامل والخسائر المدعومة بشكل ضعيف

تهدف التحديد الزمني للإجراءات على مستوى النقطة (PTAL) إلى تحديد إجراءات في مقاطع فيديو غير منقولة باستخدام تسمية زمنية واحدة فقط لكل حدث إجرائي. تعتمد الطرق الحالية على منهجية التنبؤ على مستوى الإطار لاستخلاص المعرفة من التسميات النادرة على مستوى الإطار الواحد. ومع ذلك، يعاني هذا الإطار حتمًا من فضاء حل واسع جدًا. تسعى هذه الورقة إلى استكشاف منهجية التنبؤ القائمة على الاقتراحات للعلامات على مستوى النقطة، والتي تتمتع بميزة فضاء حل أكثر قيدًا وتوقعات متسقة بين الإطارات المجاورة. تُستخدم أولاً العلامات على مستوى النقطة كإشراف على النقاط المميزة لتدريب كاشف النقاط المميزة. ثم، في مرحلة التنبؤ بالموقع، يتم إدخال وحدة خريطة بسيطة ولكن فعالة، تتيح تمرير أخطاء التدريب للخلف (back-propagation)، لربط الإطار المُشرَّف بالكامل بالإشراف الضعيف. إلى حد معرفتنا، هذه أول عمل يستخدم منهجية التدريب المُشرَّف بالكامل في البيئة المُحددة على مستوى النقطة. تؤكد التجارب على مجموعات بيانات THUMOS14 وBEOID وGTEA الفعالية الكمية والكيفية لطريقة الاقتراح المُقترحة، وتدل على أن أداء طريقة الاقتراح المُقترحة يفوق الطرق الحالية الأفضل في مجالها.