إعادة النظر في التعرف على الحركات بناءً على الهيكل العظمي

الهيكل العظمي البشري، كتمثيل مكثف للحركة البشرية، حظي باهتمام متزايد في السنوات الأخيرة. اعتمدت العديد من طرق التعرف على الحركة القائمة على الهيكل العظمي شبكات التحويل الرسومية (GCN) لاستخراج الخصائص فوق الهياكل العظمية البشرية. رغم النتائج الإيجابية التي أظهرتها الدراسات السابقة، فإن الطرق القائمة على GCN تعاني من قيود في المتانة والتوافق والقابلية للتطوير. في هذا البحث، نقترح PoseC3D، وهي طريقة جديدة للتعرف على الحركة القائمة على الهيكل العظمي، والتي تعتمد على تراكم خرائط الحرارة ثلاثية الأبعاد بدلاً من سلسلة الرسم البياني كتمثيل أساسي للهيكل العظمي البشري. مقارنة بالطرق القائمة على GCN، فإن PoseC3D أكثر فعالية في تعلم الخصائص المكانية-الزمانية، وأكثر متانة ضد ضوضاء تقدير الوضعيات، وتعمم بشكل أفضل في الإعدادات عبر المجموعات البيانات. بالإضافة إلى ذلك، يمكن لـ PoseC3D التعامل مع السيناريوهات المتعددة الأشخاص دون زيادة تكاليف الحسابات الإضافية، ويمكن دمج خصائصها بسهولة مع الوسائط الأخرى في مراحل الدمج المبكرة، مما يوفر مجالًا تصميميًا كبيرًا لتعزيز الأداء بشكل أكبر. على أربع مجموعات بيانات صعبة، حقق PoseC3D أداءً متفوقًا باستمرار عند استخدامه بمفرده على الهياكل العظمية وفي تركيبه مع وسيلة RGB.