استخلاص المعرفة من نماذج إعادة بناء الشكل من الصور الطبيعية لتعلم وضع الجسم ثلاثي الأبعاد برقابة ضعيفة

نقترح تعلم مقدر وضع ثلاثي الأبعاد من خلال استخلاص المعرفة من طرق بنية الحركة غير المرنة (Non-Rigid Structure from Motion - NRSfM). يستخدم أسلوبنا فقط شروحات معالم ثنائية الأبعاد، ولا يتطلب أي بيانات ثلاثية الأبعاد أو مشاهد متعددة/مؤقتة أو سابقة خاصة بالكائن. هذا يخفف من عقبة البيانات، وهي إحدى المخاوف الرئيسية للطرق الإشرافية. التحدي في استخدام NRSfM كمعلم هو أنه غالبًا ما يقوم بإعادة بناء عمق سيء عندما تكون الشروحات ثنائية الأبعاد ذات غموض قوي. استخدام هذه الأعماق الخاطئة مباشرة كأهداف صلبة سينعكس سلبًا على الطالب. بدلاً من ذلك، نقترح خسارة جديدة تربط توقع العمق بوظيفة التكلفة المستخدمة في NRSfM. هذا يمنح مقدر الوضع الثلاثي الأبعاد حرية تقليل خطأ العمق عن طريق الارتباط بخصائص الصورة. تم التحقق منه على مجموعة بيانات H3.6M، حيث حقق شبكتنا لتقدير الوضع الثلاثي الأبعاد إعادة بناء أكثر دقة مقارنة بطرق NRSfM. كما أنه يتفوق على الطرق الإشرافية الضعيفة الأخرى، رغم استخدامه إشرافًا أقل بكثير.