نهج رأسي مدرك لمسافة الكاميرا لتقدير وضعية متعددة الأشخاص في ثلاث أبعاد من صورة RGB واحدة

رغم التحسينات المهمة التي تحققت مؤخرًا في تقدير وضع الإنسان ثلاثي الأبعاد، فإن معظم الطرق السابقة تعالج حالة الشخص الواحد فقط. في هذا العمل، نقترح لأول مرة منهجية شاملة تعتمد على التعلم الآلي وتشمل الوعي بمسافة الكاميرا، وهي منهجية من أعلى إلى أسفل لتقدير وضع عدة أشخاص ثلاثي الأبعاد من صورة RGB واحدة. يتكون خط أنابيب النظام المقترح من ثلاثة مكونات: اكتشاف الإنسان، تحديد موقع الجذر البشري المطلق ثلاثي الأبعاد، وتقدير وضع الشخص الواحد ثلاثي الأبعاد النسبي للجذر. يحقق نظامنا نتائج مماثلة لنماذج تقدير وضع الشخص الواحد ثلاثي الأبعاد الأكثر تقدمًا دون الحاجة إلى أي معلومات حقيقية (groundtruth)، ويتفوق بشكل كبير على الطرق السابقة لتقدير وضع عدة أشخاص ثلاثي الأبعاد في مجموعة بيانات عامة متاحة.الكود متاح في الروابط التالية:https://github.com/mks0601/3DMPPE_ROOTNET_RELEASE ،https://github.com/mks0601/3DMPPE_POSENET_RELEASE.