HyperAIHyperAI

Command Palette

Search for a command to run...

شبكات التويفع الثنائية المخفية لتمييز الأفعال

Yi Zhu Zhenzhong Lan Shawn Newsam Alexander Hauptmann

الملخص

تحليل مقاطع الفيديو للحركات البشرية يتضمن فهم العلاقات الزمنية بين الإطارات الفيديوية. تعتمد أحدث طرق التعرف على الحركات على الأساليب التقليدية لتقدير التدفق البصري لحساب معلومات الحركة مسبقًا للشبكات العصبية الم convo�ولية (CNNs). مثل هذا النهج ذو المرحلتين يكون باهظ التكلفة من الناحية الحسابية، يتطلب تخزينًا كبيرًا، ولا يمكن تدريبه بشكل شامل من البداية إلى النهاية. في هذه الورقة البحثية، نقدم هندسة شبكة عصبية م convo�ولية جديدة تلتقط المعلومات الحركية بين الإطارات المجاورة بشكل ضمني. نسمّي نهجنا بـ "الشبكات الثنائية الخفية" لأنه يأخذ فقط الإطارات الفيديوية الخام كمدخلات ويتنبأ مباشرة بفئات الحركات دون حساب صريح للتدفق البصري. نهجنا الشامل من البداية إلى النهاية أسرع بمقدار 10 مرات من أساسيات النهج ذي المرحلتين. تظهر نتائج التجارب على أربعة قواعد بيانات تحدي التعرف على الحركات الصعبة: UCF101، HMDB51، THUMOS14 وActivityNet v1.2 أن نهجنا يتفوق بشكل كبير على أفضل الأساليب السابقة في الوقت الحقيقي.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
شبكات التويفع الثنائية المخفية لتمييز الأفعال | مستندات | HyperAI