تقدير الوضع ثلاثي الأبعاد للإنسان من كاميرا أحادية عميقة مع بيانات تدريب تطورية

لقد حققت تقنيات التعلم التمثيلي العميق من النهاية إلى النهاية دقة ملحوظة في تقدير الوضع البشري ثلاثي الأبعاد باستخدام الكاميرا أحادية العدسة، ومع ذلك قد تفشل هذه النماذج عند التعامل مع الأوضاع غير المألوفة بسبب البيانات التدريبية المحدودة والثابتة. يقترح هذا البحث طريقة جديدة لزيادة بيانات التدريب تتميز بـ: (1) قابلية التوسع في إنتاج كميات ضخمة من بيانات التدريب (أكثر من 8 ملايين وضع بشري ثلاثي الأبعاد صالح مع الإسقاطات ثنائية الأبعاد المقابلة) لتدريب شبكات ثنائية الأبعاد إلى ثلاثية الأبعاد، (2) القدرة على تقليل انحياز مجموعة البيانات بشكل فعال. تعتمد طريقتنا على تمثيل بشري هرمي ومبادئ استرشادية مستوحاة من المعرفة السابقة لتطوير مجموعة بيانات محدودة وإنتاج هيكل عظمي بشري ثلاثي الأبعاد غير مألوف. أظهرت التجارب الواسعة أن نهجنا ليس فقط يحقق دقة رائدة في أكبر مقاييس الأداء العامة المتاحة للجمهور، بل يعمم أيضًا بشكل أفضل بكثير على الأوضاع غير المألوفة والنادرة. يمكن الحصول على الرمز البرمجي، والنماذج المدربة مسبقًا، والأدوات عبر هذا الرابط HTTPS.请注意,由于原文中提供的HTTPS链接在阿拉伯语翻译中无法直接使用,因此在实际应用时需要将其替换为具体的URL地址。如果需要保留链接形式,可以将其放在括号内或作为脚注添加。例如:يمكن الحصول على الرمز البرمجي، والنماذج المدربة مسبقًا، والأدوات عبر هذا الرابط (HTTPS URL).