HyperAIHyperAI
منذ 2 أشهر

HigherHRNet: تعلم التمثيل الواعي للقياس لتقدير وضعية الإنسان من الأسفل إلى الأعلى

Bowen Cheng; Bin Xiao; Jingdong Wang; Honghui Shi; Thomas S. Huang; Lei Zhang
HigherHRNet: تعلم التمثيل الواعي للقياس لتقدير وضعية الإنسان من الأسفل إلى الأعلى
الملخص

تواجه طرق تقدير وضعية الإنسان من الأسفل صعوبات في التنبؤ بالوضعية الصحيحة للأفراد الصغار بسبب تحديات التباين في الحجم. في هذا البحث، نقدم HigherHRNet: طريقة جديدة لتقدير وضعية الإنسان من الأسفل تهدف إلى تعلم تمثيلات واعية للحجم باستخدام هرميات الميزات ذات الدقة العالية. مجهزة بالإشراف متعدد الدقة أثناء التدريب والجمع متعدد الدقة أثناء الاستدلال، يمكن للطريقة المقترحة حل تحدي التباين في الحجم في تقدير وضعية الإنسان من الأسفل لعدة أشخاص وتحديد النقاط الرئيسية بدقة أكبر، خاصة بالنسبة للأفراد الصغار. يتكون الهرم المميز في HigherHRNet من خرائط الميزات الناتجة عن HRNet والمخرجات ذات الدقة الأعلى التي تم رفع دقتها عبر التحويل المعكوس (transposed convolution). حقق HigherHRNet تفوقًا على أفضل طريقة سابقة من الأسفل بنسبة 2.5% AP للأفراد المتوسطة الحجم على COCO test-dev، مما يدل على فعاليته في التعامل مع التباين في الحجم. علاوة على ذلك، حقق HigherHRNet نتيجة جديدة غير مسبوقة على COCO test-dev (70.5% AP) دون استخدام تقنيات التنقيح أو المعالجة اللاحقة الأخرى، مما يتفوق على جميع الطرق الموجودة من الأسفل. حتى أنه تفوق على جميع الطرق الرأسية-أسفل (top-down) على CrowdPose test (67.6% AP)، مما يشير إلى قوته في المشاهد المزدحمة. يمكن الوصول إلى الكود والنموذج من خلال الرابط: https://github.com/HRNet/Higher-HRNet-Human-Pose-Estimation.