QuickPose: التقدير الفوري لوضعية الأشخاص متعددة المشاهد متعددة الأشخاص في المشاهد المزدحمة
{Xiaowei Zhou Hujun Bao Fashuai Li Xiaopeng Ji Qi Fang Yize Wang Qing Shuai Zhize Zhou}
الملخص
تُقترح في هذه الدراسة خوارزمية في الزمن الحقيقي لإعادة بناء وضعيات الإنسان ثلاثية الأبعاد في المشاهد المزدحمة من خلال رؤى متعددة مُعدّة مسبقًا. التحدي الرئيسي في هذه المشكلة يتمثل في مطابقة الملاحظات ثنائية الأبعاد عبر الرؤى المتعددة بشكل فعّال. إذ أجرت الطرق السابقة مطابقة الرؤى المتعددة إما على مستوى الجسم الكامل، وهو ما يجعلها حساسة لأخطاء تقدير الوضعية ثنائية الأبعاد، أو على مستوى الأجزاء، وهو ما يتجاهل القيود ثنائية الأبعاد بين أنواع مختلفة من الأجزاء في نفس الرؤية. بدلًا من ذلك، يعتمد نهجنا على التفكير في جميع الاحتمالات الممكنة لهياكل العظام أثناء عملية المطابقة عبر الرؤى المتعددة، حيث يمكن أن تتكون كل هيئة عظمية من عدد عشوائي من الأجزاء، بدلًا من أن تكون جسمًا كاملًا أو جزءًا واحدًا فقط. ولتحقيق ذلك، نُصِف مشكلة المطابقة عبر الرؤى المتعددة كمسألة البحث عن النماذج (Mode Seeking) في فضاء اقتراحات الهياكل العظمية، ونُطوّر خوارزمية فعّالة تُسمى QuickPose لحل هذه المشكلة، مما يمكّن من التقاط الحركة في الزمن الحقيقي في المشاهد المزدحمة. تُظهر التجارب أن الخوارزمية المقترحة تحقق أفضل الأداء المُسجّل من حيث السرعة والدقة على مجموعات بيانات عامة.
المعايير القياسية
| معيار قياسي | المنهجية | المقاييس |
|---|---|---|
| 3d-multi-person-pose-estimation-on-cmu | QuickPose | Average MPJPE (mm): 20.0 |
| 3d-multi-person-pose-estimation-on-shelf | QuickPose | PCP3D: 98.1 |
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.