HDNet: تقدير العمق البشري لموقع التعددية في مساحة الكاميرا

البحوث الحالية في تقدير وضعية الجسم ثلاثية الأبعاد لعدة أشخاص تركز بشكل أساسي على تقدير مواقع المفاصل ثلاثية الأبعاد نسبيًا بالنسبة للمفصل الجذري وتتجاهل المواقع المطلقة لكل وضعية. في هذا البحث، نقترح شبكة تقدير عمق الإنسان (HDNet)، وهي إطار عمل من النهاية إلى النهاية لتحديد موقع المفصل الجذري المطلق في فضاء إحداثيات الكاميرا. تقوم شبكتنا HDNet أولاً بتقدير وضعية الإنسان ثنائية الأبعاد باستخدام خرائط الحرارة للمفاصل. تخدم هذه الخرائط التقديرية كأقنعة انتباه لجمع الخصائص من المناطق الصورية المرتبطة بالشخص المستهدف. يتم استخدام شبكة عصبية رسومية (GNN) تعتمد على الهيكل العظمي لنشر الخصائص بين المفاصل. نقوم بوضع مشكلة الانحدار العمق المستهدفة كمشكلة تقدير مؤشر الدرجات، والتي يمكن تحويلها بواسطة عملية soft-argmax من مخرجات تصنيف شبكتنا HDNet. نقيم شبكتنا HDNet في مهام تحديد موقع المفصل الجذري وتقدير وضعية الجسم ثلاثية الأبعاد النسبية للمفصل الجذري باستخدام قاعدتين رئيسيتين للبيانات، وهما Human3.6M و MuPoTS-3D. تظهر النتائج التجريبية أننا نتفوق باستمرار على أفضل ما تم الوصول إليه سابقًا تحت عدة مقاييس تقييم. شفرتنا المصدر متاحة على الرابط التالي:https://github.com/jiahaoLjh/HumanDepth.