HyperAIHyperAI
منذ 2 أشهر

شبكات الألياف المتعددة للاعتراف بالفيديو

Yunpeng Chen; Yannis Kalantidis; Jianshu Li; Shuicheng Yan; Jiashi Feng
شبكات الألياف المتعددة للاعتراف بالفيديو
الملخص

في هذا البحث، نهدف إلى تقليل التكلفة الحسابية للشبكات العصبية العميقة المكانية-الزمانية، مما يجعلها تعمل بنفس سرعة نظيراتها ثنائية الأبعاد مع الحفاظ على الدقة الرائدة في مجال معايير التعرف على الفيديو. لتحقيق هذا الهدف، نقدم هندسة متعددة الألياف (Multi-Fiber) الجديدة التي تقوم بتقسيم شبكة عصبية معقدة إلى مجموعة من الشبكات الخفيفة أو الألياف التي تمر عبر الشبكة. لتسهيل تدفق المعلومات بين الألياف، قمنا أيضًا بدمج وحدات الملتيبلكسر (multiplexer)، مما أدى إلى تصميم يقلل من التكلفة الحسابية للشبكات ثلاثية الأبعاد بمقدار عشري، وفي الوقت نفسه يزيد من أداء التعرف. النتائج التجريبية الواسعة تظهر أن هندستنا المتعددة الألياف تعزز بشكل كبير كفاءة الشبكات التقنية القائمة على الإconvolution لكل من مهام التعرف على الصور والفيديوهات، حيث حققت أداءً رائدًا على مجموعات البيانات UCF-101 و HMDB-51 و Kinetics. يتطلب النموذج المقترح لدينا أقل بـ 9 مرات و 13 مرة من العمليات الحسابية مقارنة بنماذج I3D و R(2+1)D على التوالي، مع تقديم دقة أعلى.

شبكات الألياف المتعددة للاعتراف بالفيديو | أحدث الأوراق البحثية | HyperAI