HyperAIHyperAI

Command Palette

Search for a command to run...

MotionSqueeze: التعلم العصبي لميزات الحركة لفهم الفيديو

Heeseung Kwon Manjin Kim Suha Kwak Minsu Cho

الملخص

تلعب الحركة دورًا حاسمًا في فهم الفيديوهات، وغالبًا ما تُدمج المعلومات الحركية في معظم النماذج العصبية الرائدة لتصنيف الفيديو باستخدام تدفقات بصرية (optical flows) يتم استخراجها عبر طريقة منفصلة وجاهزة. وبما أن تدفقات الإطارات الفردية تتطلب حسابات مكثفة، فقد بقيت إدخال المعلومات الحركية عقبة حاسوبية رئيسية في مجال فهم الفيديو. في هذه الدراسة، نستبدل الحسابات الخارجية والثقيلة الخاصة بتدفقات البصر بتعلم داخلي خفيف الوزن لسمات الحركة. نقترح وحدة عصبية قابلة للتدريب تُسمى MotionSqueeze، لاستخراج فعّال لسمات الحركة. وتُدمج هذه الوحدة في منتصف أي شبكة عصبية، حيث تتعلم إقامة تقابلات بين الإطارات وتحويلها إلى سمات حركية، والتي يمكن إدخالها مباشرة إلى الطبقة التالية لتحسين التنبؤ. ونُظهر أن الطريقة المقترحة تحقق تحسنًا كبيرًا على أربع معايير قياسية لتمييز الحركات، مع تكلفة إضافية ضئيلة جدًا، وتتفوق على الحد الأقصى الحالي من الأداء على مجموعتي بيانات Something-Something-V1 وV2.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
MotionSqueeze: التعلم العصبي لميزات الحركة لفهم الفيديو | مستندات | HyperAI