HyperAIHyperAI

Command Palette

Search for a command to run...

تقدير وضع الإنسان ثلاثي الأبعاد باستخدام متحولات المكان والزمان

Ce Zheng Sijie Zhu Matias Mendieta Taojiannan Yang Chen Chen Zhengming Ding

الملخص

قد أصبحت هياكل الترانسفورمر (Transformer) النموذج المفضل في معالجة اللغات الطبيعية، وهي الآن تُدخل إلى مهام رؤية الحاسوب مثل تصنيف الصور، وتحديد الأشياء، والتقسيم الدلالي. ومع ذلك، في مجال تقدير الوضع البشري (Human Pose Estimation)، لا تزال الهياكل التلافيفية (Convolutional) تحتفظ بالسيطرة. في هذا العمل، نقدم PoseFormer، وهو نهج يعتمد بشكل كامل على الترانسفورمر لتقدير الوضع البشري ثلاثي الأبعاد في مقاطع الفيديو دون استخدام أي هياكل تلافيفية. مستوحى من التطورات الحديثة في الترانسفورمر الرؤية (Vision Transformers)، صممنا هيكلًا مكانيًا-زمانيًا للترانسفورمر لنمذجة العلاقات بين المفاصل البشرية داخل كل إطار بشكل شامل وكذلك الارتباطات الزمنية عبر الإطارات، ثم إخراج وضع بشري ثلاثي الأبعاد دقيق للإطار المركزي. قمنا بتقييم طريقتنا كميًا وكيفيًا على قاعدتي بيانات شهيرتين ومعياريتين: Human3.6M و MPI-INF-3DHP. أظهرت التجارب الواسعة أن PoseFormer يحقق أداءً متفوقًا على كلا القاعدتين. يمكن الحصول على الكود من الرابط \url{https://github.com/zczcwh/PoseFormer}


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp