HyperAIHyperAI
منذ 2 أشهر

WOAD: الكشف عن الأحداث بشكل ضعيف الإشراف في مقاطع الفيديو غير المقصوصة عبر الإنترنت

Gao, Mingfei ; Zhou, Yingbo ; Xu, Ran ; Socher, Richard ; Xiong, Caiming
WOAD: الكشف عن الأحداث بشكل ضعيف الإشراف في مقاطع الفيديو غير المقصوصة عبر الإنترنت
الملخص

اكتشاف الأنشطة عبر الإنترنت في مقاطع الفيديو غير المقصوصة يهدف إلى تحديد النشاط أثناء حدوثه، مما يجعله مهمًا للغاية للتطبيقات الزمنية الحقيقية. تعتمد الطرق السابقة على تسميات زمنية مفصلة لحدود الأنشطة للتدريب، مما يعيق قابلية توسيع أنظمة اكتشاف الأنشطة عبر الإنترنت. نقترح نظام WOAD، وهو إطار تحت إشراف ضعيف يمكن تدريبه باستخدام تسميات فئات الفيديو فقط. يتكون WOAD من وحدتين يتم تدريبهما معًا، وهما مولد الاقتراحات الزمنية (TPG) ومحرك التعرف على الأنشطة عبر الإنترنت (OAR). تحت إشراف تسميات فئات الفيديو، يعمل TPG بشكل غير متصل ويستهدف استخراج التسميات الإطارية الوهمية بدقة لـ OAR. بفضل الإشارات الرقابية من TPG، يتعلم OAR كيفية إجراء اكتشاف الأنشطة بطريقة عبر الإنترنت. أظهرت النتائج التجريبية على THUMOS'14 و ActivityNet1.2 و ActivityNet1.3 أن طريقتنا تحت إشراف ضعيف تتفوق بشكل كبير على نقاط الأساس الخاضعة لإشراف ضعيف وتحقق أداءً مشابهًا للطرق السابقة الخاضعة لإشراف قوي. بالإضافة إلى ذلك، فإن WOAD مرنة بما يكفي للاستفادة من الإشراف القوي عند توفره. عند الخضوع للإشراف القوي، تحصل طريقتنا على أفضل النتائج الحالية في مهام التعرف على الأنشطة لكل إطار بشكل عبر الإنترنت واكتشاف بداية النشاط.请注意,这里的人名和机构名称(如THUMOS'14, ActivityNet1.2, ActivityNet1.3)在阿拉伯语中通常会保留其原始形式,以确保准确性。同时,为了保持专业性和信息完整性,一些不常见的术语(如temporal proposal generator (TPG) 和online action recognizer (OAR))也在括号中标注了原文。