HyperAIHyperAI

Command Palette

Search for a command to run...

PERF-Net: شبكة RGB-Flow مُزوّدة بالوضعية

Yinxiao Li Zhichao Lu Xuehan Xiong Jonathan Huang

الملخص

في السنوات الأخيرة، أظهرت العديد من الدراسات في مجال التعرف على الحركات في الفيديو أن النماذج ذات التدفق المزدوج (التي تدمج تدفقي الصورة الفضائية والزمنية) ضرورية لتحقيق الأداء المتفوق في مستوى الحد الأقصى. في هذه الورقة، نُظهر فوائد إدراج تدفق إضافي مبني على وضعية الإنسان المستخرجة من كل إطار — وبشكل محدد، من خلال عرض وضعية الإنسان على الإطارات الملونة (RGB) الأصلية. قد يبدو هذا التدفق الإضافي في البداية تكرارًا، بالنظر إلى أن وضعية الإنسان تُحدد بالكامل من قيم بكسلات RGB — ولكننا نُظهر (ربما بشكل مفاجئ) أن هذه الإضافة البسيطة والمُتعددة الاستخدامات يمكن أن تُقدِّم مكاسب مكملة. وباستناد إلى هذه الملاحظة، نقترح نموذجًا جديدًا يُسمَّى PERF-Net (بمعنى: الشبكة المُعزَّزة بالوضعية RGB-Flow)، والذي يدمج هذا التدفق الجديد مع التدفقيين القياسيين (RGB والتدفق البصري) باستخدام تقنيات التجميع (distillation)، ونُظهر أن نموذجنا يتفوق على الأداء المتفوق في عدد من مجموعات بيانات التعرف على الحركات البشرية بشكل كبير، دون الحاجة إلى حساب التدفق أو الوضعية صراحةً أثناء عملية الاستنتاج (inference). كما أن التدفق المُقترح للوضعية يُشكِّل جزءًا من الحل الفائز في مسابقة ActivityNet Kinetics Challenge 2020.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp