انحدار وضعية الإنسان باستخدام تقدير احتمال التباعد المتبقِّي

تُهيمن الطرق القائمة على الخرائط الحرارية (Heatmap-based methods) في مجال تقدير وضعية الإنسان من خلال نمذجة توزيع الإخراج باستخدام خرائط الاحتمالية (likelihood heatmaps). في المقابل، تتميز الطرق القائمة على الانحدار (regression-based methods) بالكفاءة الأعلى، لكنها تعاني من أداء أقل. في هذه الدراسة، نستكشف تقدير الاحتمالية العظمى (Maximum Likelihood Estimation - MLE) لتطوير طريقة قائمة على الانحدار تكون فعّالة وكفؤة في الوقت نفسه. من منظور MLE، فإن استخدام خسائر انحدار مختلفة يُفترض افتراضات مختلفة حول دالة كثافة الإخراج. وكلما اقتربت دالة الكثافة من التوزيع الحقيقي، زادت كفاءة الانحدار. بناءً على ذلك، نقترح نموذجًا جديدًا قائمة على الانحدار يعتمد على تقدير الاحتمالية المتبقية (Residual Log-likelihood Estimation - RLE)، والذي يهدف إلى التقاط التوزيع الكامن وراء الإخراج. وبشكل محدد، يتعلم RLE تغير التوزيع بدلاً من التوزيع الكامن غير المرجعي، مما يسهل عملية التدريب. وبفضل التصميم المُعاد صياغته (reparameterization design) الذي اقترحناه، يُمكن لطريقتنا التوافق مع نماذج التدفق الجاهزة (off-the-shelf flow models). وتُظهر طريقتنا فعالية عالية وكفاءة ومرنّة. ونُظهر إمكاناتها في مجموعة متنوعة من مهام تقدير وضعية الإنسان من خلال تجارب شاملة. ومقارنةً بالنمط التقليدي للانحدار، فإن الانحدار باستخدام RLE يحقق تحسنًا قدره 12.4 نقطة في مقياس mAP على مجموعة بيانات MSCOCO دون أي تكلفة إضافية عند التقييم. علاوةً على ذلك، ولأول مرة، تتفوق طريقتنا القائمة على الانحدار على الطرق القائمة على الخرائط الحرارية، خاصة في مهام تقدير وضعية عدة أشخاص. يمكن الاطلاع على الكود الخاص بنا عبر الرابط التالي: https://github.com/Jeff-sjtu/res-loglikelihood-regression