HyperAIHyperAI
منذ 2 أشهر

PoseRAC: محول البارزة للوضعية لعد الأفعال المتكررة

Ziyu Yao; Xuxin Cheng; Yuexian Zou
PoseRAC: محول البارزة للوضعية لعد الأفعال المتكررة
الملخص

يقدم هذا البحث مساهمة مهمة في مجال عد الأفعال المتكررة من خلال تقديم نهج جديد يُسمى تمثيل الوضوح البوزي (Pose Saliency Representation). يمثل النهج المقترح كل فعل بكفاءة باستخدام وضعين بارزين فقط بدلاً من الإطارات الزائدة، مما يقلل بشكل كبير من التكلفة الحسابية مع تحسين الأداء. بالإضافة إلى ذلك، نقدم طريقة على مستوى البوز تُسمى PoseRAC، والتي تعتمد على هذا التمثيل وتحقق أداءً رائدًا في صناعة الأبحاث على مجموعة بيانات جديدة بإصدارين من خلال استخدام تمثيل الوضوح البوزي (Pose Saliency Annotation) لتحديد الوضعين البارزين للتدريب. نموذجنا الخفيف الوزن يتميز بكفاءة عالية، حيث يحتاج إلى 20 دقيقة فقط للتدريب على وحدة معالجة الرسومات (GPU)، ويستنتج بنحو 10 مرات أسرع مقارنة بالطرق السابقة. علاوة على ذلك، حققت طريقتنا تحسينًا كبيرًا على الطريقة الرائدة سابقًا TransRAC، حيث بلغت قيمة مؤشر OBO 0.56 مقارنة بـ 0.29 لـ TransRAC. يمكن الوصول إلى الكود ومجموعة البيانات الجديدة عبر الرابط https://github.com/MiracleDance/PoseRAC لأغراض البحث والتجربة الإضافية، مما يجعل نهجنا المقترح متاحًا للغاية للمجتمع البحثي.

PoseRAC: محول البارزة للوضعية لعد الأفعال المتكررة | أحدث الأوراق البحثية | HyperAI