تقدير وضعية جسم الإنسان بالكامل في البيئة البرية

تُركّز هذه الورقة البحثية على مهمة تقدير وضعية الجسد البشري ثنائي الأبعاد (2D Whole-Body Pose Estimation)، والتي تهدف إلى تحديد نقاط مميزة كثيفة على كامل جسم الإنسان، بما في ذلك الوجه، واليدين، والجذع، والأقدام. وبما أن المجموعات المتاحة سابقًا لا تحتوي على تسميات شاملة للجسد، اضطرت الطرق السابقة إلى دمج نماذج عميقة مختلفة تم تدريبها بشكل مستقل على مجموعات بيانات مختلفة مخصصة للوجه البشري، واليدين، والجذع، ما أدى إلى مواجهة مشكلات تحيز المجموعة (dataset biases) وتعقيد النموذج الكبير. ولسد هذه الفجوة، نقدّم مجموعة بيانات جديدة تُسمى COCO-WholeBody، التي تم توسيع مجموعة COCO بإضافة تسميات شاملة للجسد البشري. إلى حد معرفتنا، تعد هذه المجموعة أول معيار معياري (benchmark) يحتوي على تسميات يدوية على كامل الجسد البشري، تشمل 133 نقطة مميزة كثيفة، منها 68 نقطة على الوجه، و42 نقطة على اليدين، و23 نقطة على الجذع والأقدام. تم تصميم نموذج واحد يُسمى ZoomNet، يأخذ بعين الاعتبار البنية الهرمية للجسد البشري الكامل، بهدف معالجة التغير في الحجم بين أجزاء الجسد المختلفة لدى نفس الشخص. ويُظهر ZoomNet أداءً متفوقًا بشكل كبير مقارنة بالطرق الحالية على مجموعة بيانات COCO-WholeBody المُقدمة. وتُظهر التجارب الواسعة أن مجموعة COCO-WholeBody لا تُستخدم فقط لتدريب نماذج عميقة من الصفر لتقدير وضعية الجسد الكامل، بل يمكنها أيضًا أن تُعدّ مصدرًا قويًا للتدريب المسبق (pre-training) لمهام متعددة مثل كشف نقاط الوجه وتقدير نقاط اليدين. تُتاح المجموعة العامة للجمهور عبر الرابط: https://github.com/jin-s13/COCO-WholeBody.