HyperAIHyperAI
منذ 18 أيام

شبكة تصفية ديناميكية حساسة للسياق للكشف عن الكائنات البارزة في الفيديو

{Zhongxuan Luo, Huchuan Lu, Jingjing Li, Wei Ji, Shunyu Yao, Yongri Piao, Yifei Wang, Jie Liu, Miao Zhang}
شبكة تصفية ديناميكية حساسة للسياق للكشف عن الكائنات البارزة في الفيديو
الملخص

يمثل القدرة على التقاط الديناميكيات بين الإطارات عنصراً حاسماً في تطوير الكشف عن الكائنات المميزة في الفيديو (VSOD). وعلى الرغم من النجاح الكبير الذي حققته العديد من الدراسات في هذا المجال، لا يزال هناك حاجة إلى فهم أعمق للطبيعة الديناميكية لهذا التحدي. في هذا العمل، نهدف إلى الإجابة على الأسئلة التالية: كيف يمكن للنموذج أن يتكيف مع التغيرات الديناميكية، وكيف يمكنه إدراك الفروق الدقيقة في البيئة الواقعية؟ وكيف يمكن دمج الديناميكيات الزمنية بشكل فعّال في المعلومات المكانية على مر الزمن؟ لحل هذه التحديات، نقترح شبكة تصفية حساسة للسياق الديناميكي (DCFNet)، مزودة بوحدة تصفية حساسة للسياق الديناميكي (DCFM) واستراتيجية تكامل ديناميكية ثنائية الاتجاه فعّالة. تقدم وحدة DCFM رؤية جديدة لعملية توليد الفلاتر الديناميكية من خلال استخلاص الترابطات المرتبطة بالموقع بين الإطارات المتتالية. كما تُشجع الاستراتيجية الثنائية الاتجاه للدمج الديناميكي على التفاعل بين المعلومات المكانية والزمنية بطريقة ديناميكية. تُظهر النتائج التجريبية أن الطريقة المقترحة تحقق أداءً من الدرجة الأولى على معظم مجموعات بيانات VSOD، مع الحفاظ على سرعة زمنية حقيقية تصل إلى 28 إطاراً في الثانية. تم إتاحة الشفرة المصدرية بشكل عام عبر الرابط التالي: https://github.com/OIPLab-DUT/DCFNet.