HyperAIHyperAI

Command Palette

Search for a command to run...

شبكات متعددة التدفقات المتسلسلة التي تستغل الوضع والحركة والمظهر لتصنيف وتكتشاف الأفعال

Mohammadreza Zolfaghari; Gabriel L. Oliveira; Nima Sedaghat; Thomas Brox

الملخص

التعرف على الأفعال البشرية بشكل عام يتطلب فهمًا لمجموعة متنوعة من العلامات البصرية. في هذا البحث، نقترح هندسة شبكة تُحسب وتُدمج فيها أهم العلامات البصرية للتعرف على الأفعال: الوضع (البوص)، الحركة، والصور الخام. لغرض الدمج، نقدم نموذج سلسلة ماركوف يضيف العلامات تباعًا. النهج الناتج فعال ويمكن تطبيقه على تصنيف الأفعال وكذلك تحديد موقعها المكاني والزماني. المساهمتان تحسنان بوضوح الأداء فوق القواعد الأساسية المناظرة. يحقق النهج الشامل أداءً رائدًا في تصنيف الأفعال على مجموعات البيانات HMDB51 و J-HMDB و NTU RGB+D. بالإضافة إلى ذلك، ينتج نتائج تحديد الموقع المكاني والزماني للأفعال التي تعتبر رائدة في مجالها على مجموعتي بيانات UCF101 و J-HMDB.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
شبكات متعددة التدفقات المتسلسلة التي تستغل الوضع والحركة والمظهر لتصنيف وتكتشاف الأفعال | مستندات | HyperAI