HyperAIHyperAI
منذ 17 أيام

المحوّل التوقيتي للإجراءات الضعيف المراقب مع قمع الإيجابيات الخاطئة الموجهة بـ Actionness

{Zilei Wang, Zhilin Li}
الملخص

تهدف التصنيف الزمني للإجراءات الضعيف المراقب إلى تحديد الحدود الزمنية لInstances الإجرائية في مقاطع الفيديو غير المُعدّلة باستخدام تسميات على مستوى الفيديو وتعيينها إلى الفئة الإجرائية المقابلة. عادةً، يتم حل هذه المهمة من خلال مسار يُسمى "التحديد من خلال التصنيف"، والذي يُحدد Instances الإجرائية من خلال تصنيف مقاطع الفيديو القصيرة. ومع ذلك، نظرًا لأن هذا النهج يُحسّن دالة التصنيف على مستوى الفيديو، فإن التسلسلات الناتجة من التنشيط غالبًا ما تتعرض لتأثيرات من المشاهد المرتبطة بالفئات، مما يؤدي إلى عدد كبير من النتائج الخاطئة الإيجابية في التنبؤات. تتعامل العديد من الدراسات الحالية مع الخلفية كفئة مستقلة، مما يُجبر النموذج على تعلّم التمييز بين مقاطع الخلفية. لكن في ظل ظروف التدريب الضعيف، تكون معلومات الخلفية ضبابية وغير مؤكدة، مما يجعل هذا الأسلوب شديد الصعوبة. لتفادي تأثير النتائج الخاطئة الإيجابية، نقترح إطارًا جديدًا يُسمى "قمع النتائج الخاطئة الإيجابية الموجهة بالفعل الإجرائي". يسعى هذا الأسلوب إلى قمع الخلفيات الخاطئة دون إدخال فئة الخلفية. أولاً، نقترح فرعًا تدريبيًا ذاتيًا للإحساس الإجرائي (actionness)، لتعلم الإحساس الإجرائي المستقل عن الفئة، والذي يمكنه تقليل تأثير معلومات المشهد المرتبطة بالفئة من خلال تجاهل تسميات الفيديو. ثانيًا، نقترح وحدة قمع النتائج الخاطئة الإيجابية لاستخراج مقاطع النتائج الخاطئة الإيجابية وقمعها. وأخيرًا، نُدخل وحدة تعزيز المقدمة (foreground enhancement)، التي توجه النموذج لتعلم المقدمة باستخدام آلية الانتباه بالإضافة إلى الإحساس الإجرائي المستقل عن الفئة. أجرينا تجارب واسعة على ثلاث معايير (THUMOS14، ActivityNet1.2، وActivityNet1.3). تُظهر النتائج فعالية طريقة لدينا في قمع النتائج الخاطئة الإيجابية، وتحقيقها لأفضل أداء مُحقّق حتى الآن. الكود: https://github.com/lizhilin-ustc/AFPS.

المحوّل التوقيتي للإجراءات الضعيف المراقب مع قمع الإيجابيات الخاطئة الموجهة بـ Actionness | أحدث الأوراق البحثية | HyperAI