HyperAIHyperAI
منذ 11 أيام

NTU-X: مجموعة بيانات كبيرة مُحسَّنة لتحسين التعرف على الحركات البشرية الدقيقة القائمة على الوضعية

Neel Trivedi, Anirudh Thatipelli, Ravi Kiran Sarvadevabhatla
NTU-X: مجموعة بيانات كبيرة مُحسَّنة لتحسين التعرف على الحركات البشرية الدقيقة القائمة على الوضعية
الملخص

يعتبر غياب المفاصل الدقيقة (مثل مفاصل الوجه والأصابع) عائقًا أداءً جوهريًا للنماذج الحديثة المعتمدة على الهيكل العظمي في التعرف على الحركات البشرية. وعلى الرغم من هذا العائق، يبدو أن جهود المجتمع تتركز فقط على تطوير هياكل جديدة. ولحل هذا العائق بشكل محدد، نقدم مجموعتين جديدتين من البيانات القائمتين على الوضعية البشرية - NTU60-X وNTU120-X. تمتد هذه المجموعات إلى أكبر مجموعة بيانات موجودة حاليًا للتعرف على الحركات، وهي NTU-RGBD. وبالإضافة إلى 25 مفصلًا جسمانيًا لكل هيكل عظمي كما في NTU-RGBD، تضم مجموعتا NTU60-X وNTU120-X أيضًا مفاصل الأصابع والوجه، مما يتيح تمثيلًا أثخنًا للهيكل العظمي. وقد قمنا بتعديل مناسب للأساليب الحديثة لتمكين التدريب باستخدام المجموعات المقدمة. وتبين نتائجنا فعالية مجموعات NTU-X في التغلب على العائق المذكور، وتحسين الأداء في الحد الأقصى للنماذج الحالية، سواء بشكل عام أو في الفئات السابقة التي كانت تُعاني من أداء ضعيف. يمكن العثور على الكود والنماذج المُدرَّبة مسبقًا على الرابط التالي: https://github.com/skelemoa/ntu-x.

NTU-X: مجموعة بيانات كبيرة مُحسَّنة لتحسين التعرف على الحركات البشرية الدقيقة القائمة على الوضعية | أحدث الأوراق البحثية | HyperAI