HyperAIHyperAI

Command Palette

Search for a command to run...

VoxelPose: نحو التقدير ثلاثي الأبعاد لوضعية الإنسان باستخدام كاميرات متعددة في البيئات الطبيعية

Hanyue Tu Chunyu Wang Wenjun Zeng

الملخص

نقدم نهجًا لتقدير الوضع الثلاثي الأبعاد (3D) لعدة أشخاص من خلال زوايا كاميرات متعددة. على عكس الجهود السابقة التي تتطلب إقامة تطابق بين الزوايا المختلفة بناءً على تقديرات ثنائية الأبعاد (2D) غير دقيقة وغير كاملة، نقدّم حلًا من الطرف إلى الطرف (end-to-end) يعمل مباشرة في الفضاء الثلاثي الأبعاد، وبالتالي يتجنب اتخاذ قرارات خاطئة في الفضاء الثنائي الأبعاد. لتحقيق هذا الهدف، يتم تحويل الميزات من جميع زوايا الكاميرات ودمجها في فضاء ثلاثي أبعاد مشترك، ثم تُقدَّم إلى شبكة اقتراح المكعبات (Cuboid Proposal Network - CPN) لتحديد موضع أولي لجميع الأشخاص. ثم نقترح شبكة استرجاع الوضع (Pose Regression Network - PRN) لتقدير وضع ثلاثي الأبعاد دقيق لكل اقتراح. يتميز هذا النهج بالقدرة على التحمل تجاه التغطية (الإغلاق الجزئي)، وهي حالة شائعة في التطبيقات العملية. وبلا إضافات مُضافة، يتفوق هذا النهج على أفضل النماذج الحالية على مجموعات البيانات العامة. سيتم إصدار الكود على الرابط التالي: https://github.com/microsoft/multiperson-pose-estimation-pytorch.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp