HyperAIHyperAI
منذ 15 أيام

فاستر فوكسلPose: تقدير وضعية الإنسان ثلاثية الأبعاد في الزمن الفعلي من خلال التصوير الأرثوغرافي

Hang Ye, Wentao Zhu, Chunyu Wang, Rujie Wu, Yizhou Wang
فاستر فوكسلPose: تقدير وضعية الإنسان ثلاثية الأبعاد في الزمن الفعلي من خلال التصوير الأرثوغرافي
الملخص

بينما حققت الطرق القائمة على الفوكسل نتائج واعدة في تقدير وضعية الأشخاص متعددة الأشخاص ثلاثية الأبعاد من كاميرات متعددة، إلا أنها تعاني من أعباء حسابية كبيرة، خاصة في المشاهد الواسعة. نقدم "فاستير فوكسل بوز" (Faster VoxelPose) لمعالجة هذه التحديات من خلال إعادة ت投影 حجم الميزات إلى ثلاث مستويات ثنائية الأبعاد، وتقدير إحداثيات X وY وZ بشكل منفصل من هذه المستويات. ولتحقيق ذلك، نقوم أولاً بتحديد موقع كل شخص باستخدام صندوق محاط ثلاثي الأبعاد (3D bounding box)، وذلك من خلال تقدير صندوق ثنائي الأبعاد (2D box) وارتفاعه استنادًا إلى ميزات الحجم المُشَعَّة إلى المستوى xy والمحور z على التوالي. ثم، لكل شخص، نُقدّر إحداثيات المفاصل الجزئية من خلال المستويات الثلاثة بشكل منفصل، وتُدمج هذه الإحداثيات لاستخلاص الوضعية ثلاثية الأبعاد النهائية. ويتميز هذا الأسلوب بعدم الحاجة إلى الشبكات العصبية ثلاثية الأبعاد (3D-CNNs) ذات التكلفة العالية، مما يُحسّن سرعة أداء "فوكسل بوز" بعشرة أضعاف، مع الحفاظ على دقة تنافسية توازي أفضل الطرق الحالية، مما يثبت إمكاناته الكبيرة في التطبيقات الزمنية الحقيقية.

فاستر فوكسلPose: تقدير وضعية الإنسان ثلاثية الأبعاد في الزمن الفعلي من خلال التصوير الأرثوغرافي | أحدث الأوراق البحثية | HyperAI