HyperAIHyperAI

Command Palette

Search for a command to run...

تعلم قواعد الوضع لتمثيل تكوين الجسم البشري لتقدير الوضع الثلاثي الأبعاد

Fang Haoshu Xu Yuanlu Wang Wenguan Liu Xiaobai Zhu Song-Chun

الملخص

في هذا البحث، نقترح استخدام قواعد موضعية (Pose Grammar) لمعالجة مشكلة تقدير وضعية الإنسان ثلاثية الأبعاد. يعتمد نموذجنا على إدخال وضعية ثنائية الأبعاد مباشرة، ويعمل على تعلُّم دالة تحويل عامة من الوضعية ثنائية الأبعاد إلى ثلاثية الأبعاد. ويتكوّن النموذج المقترح من شبكة أساسية تُمكّن من التقاط ميزات مُتماشية مع الوضعية، إلى جانب هيكل من شبكات التكرار ثنائية الاتجاه (Bi-directional RNNs - BRNN) مُرتّبة هرميًا فوقها، والتي تُدمج بشكل صريح مجموعة من المعرفة المتعلقة بتكوين جسم الإنسان (مثل الديناميكا الحركية، التماثل، التنسيق الحركي). وبذلك، يفرض النموذج قيودًا عالية المستوى على الوضعيات البشرية. وفي عملية التدريب، قمنا بتطوير مُحاكي عينات وضعية (Pose Sample Simulator) لتوسيع عينات التدريب عبر منظورات افتراضية للكاميرات، مما يُعزز من قدرة النموذج على التعميم. وقد قمنا بتوثيق أداء الطريقة على معايير عامة لتقدير الوضعية ثلاثية الأبعاد، كما اقترحنا بروتوكول تقييم جديد يعمل في بيئة متعددة المنظورات (cross-view setting)، بهدف التحقق من قدرة التعميم المختلفة بين الطرق. ولاحظنا تجريبيًا أن معظم الطرق المتطورة حاليًا تواجه صعوبات في هذا السياق، بينما يتمكّن نموذجنا من التعامل بفعالية مع هذه التحديات.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp