الإشراف المتبادل التكيفي للتحديد الزمني للإجراءات بمرافقة ضعيفة

تهدف التصنيف الزمني للإجراءات الضعيف المُراقب إلى تحديد مواقع الإجراءات في مقاطع الفيديو غير المُختصرة باستخدام علامات فئة الإجراء فقط على مستوى الفيديو. تعاني معظم الطرق السابقة من إهمال مشكلة عدم الاكتمال في تسلسلات التفعيل الفئوي (CAS)، مما يؤدي إلى نتائج تحليلية تافهة. ولحل هذه المشكلة، نقدّم إطارًا تفاعليًا تلقائيًا للإشراف (AMS) مكوّنًا من فرعين: حيث يستخدم الفرع الأساسي تسلسلات التفعيل الفئوي (CAS) لتحديد مناطق الإجراء الأكثر تمييزًا، بينما يُحدّد الفرع المكمل مناطق الإجراء الأقل تمييزًا من خلال عامل عينات تلقائي مبتكر. يُحدّث عامل العينات التلقائي ديناميكيًا مدخلات الفرع المكمل باستخدام تسلسل أوزان عينة مرتبط سالبًا بتسلسل التفعيل الفئوي من الفرع الأساسي، مما يشجع الفرع المكمل على تحديد مناطق الإجراءات التي يُهملها الفرع الأساسي. ولتعزيز التحسين التفاعلي بين الفرعين، نُنشئ إشرافًا تفاعليًا على الموقع، حيث يستخدم كل فرع علامات تنبؤية بالمكان المُنشأة من الفرع الآخر كإشراف على التحديد. وباستخدام التحسين المتكرر للفرعين على مدى عدة تكرارات، نُكمل تدريجيًا مناطق الإجراء. تُظهر التجارب الواسعة على مجموعتي بيانات THUMOS14 وActivityNet1.2 أن الطريقة المقترحة AMS تتفوّق بشكل كبير على أحدث الطرق المُطورة.