Command Palette
Search for a command to run...
تعلم قواعد الوضع لتمثيل تكوين الجسم البشري لتقدير الوضع الثلاثي الأبعاد
تعلم قواعد الوضع لتمثيل تكوين الجسم البشري لتقدير الوضع الثلاثي الأبعاد
Fang Haoshu Xu Yuanlu Wang Wenguan Liu Xiaobai Zhu Song-Chun
الملخص
في هذا البحث، نقترح استخدام قواعد موضعية (Pose Grammar) لمعالجة مشكلة تقدير وضعية الإنسان ثلاثية الأبعاد. يعتمد نموذجنا على إدخال وضعية ثنائية الأبعاد مباشرة، ويعمل على تعلُّم دالة تحويل عامة من الوضعية ثنائية الأبعاد إلى ثلاثية الأبعاد. ويتكوّن النموذج المقترح من شبكة أساسية تُمكّن من التقاط ميزات مُتماشية مع الوضعية، إلى جانب هيكل من شبكات التكرار ثنائية الاتجاه (Bi-directional RNNs - BRNN) مُرتّبة هرميًا فوقها، والتي تُدمج بشكل صريح مجموعة من المعرفة المتعلقة بتكوين جسم الإنسان (مثل الديناميكا الحركية، التماثل، التنسيق الحركي). وبذلك، يفرض النموذج قيودًا عالية المستوى على الوضعيات البشرية. وفي عملية التدريب، قمنا بتطوير مُحاكي عينات وضعية (Pose Sample Simulator) لتوسيع عينات التدريب عبر منظورات افتراضية للكاميرات، مما يُعزز من قدرة النموذج على التعميم. وقد قمنا بتوثيق أداء الطريقة على معايير عامة لتقدير الوضعية ثلاثية الأبعاد، كما اقترحنا بروتوكول تقييم جديد يعمل في بيئة متعددة المنظورات (cross-view setting)، بهدف التحقق من قدرة التعميم المختلفة بين الطرق. ولاحظنا تجريبيًا أن معظم الطرق المتطورة حاليًا تواجه صعوبات في هذا السياق، بينما يتمكّن نموذجنا من التعامل بفعالية مع هذه التحديات.