PoseFix: شبكة تحسين الوضعية البشرية العامة المستقلة عن النموذج

تقدير وضعية متعددة الأشخاص من صورة ثنائية الأبعاد هو تقنية أساسية لفهم سلوك الإنسان. في هذا البحث، نقترح شبكة تحسين وضعية الإنسان التي تقدر وضعية محسنة من مجموعة تتكون من صورة مدخل ووضعية مدخل. كان التحسين الوضعي يتم بشكل رئيسي من خلال هندسة متعددة المراحل قابلة للتدريب من النهاية إلى النهاية في الأساليب السابقة. ومع ذلك، فإن هذه الأساليب تعتمد بشكل كبير على نماذج تقدير الوضعية وتتطلب تصميمًا دقيقًا للنموذج. بخلاف ذلك، نقترح طريقة تحسين وضعية مستقلة عن النموذج (model-agnostic). وفقًا لدراسة حديثة، فإن أفضل الأساليب الحالية لتقدير وضعية الإنسان ثنائية الأبعاد لديها توزيعات أخطاء مشابهة. نستخدم هذه الإحصائيات للأخطاء كمعلومات أولية لتوليد وضعيات اصطناعية واستخدام الوضعيات المصنعة لتدريب نموذجنا. في مرحلة الاختبار، يمكن إدخال نتائج تقدير الوضعية لأي أساليب أخرى إلى الطريقة المقترحة. بالإضافة إلى ذلك، لا يتطلب النموذج المقترح الرمز أو المعرفة حول الأساليب الأخرى، مما يسمح باستخدامه بسهولة في خطوة المعالجة ما بعد التشغيل (post-processing). نوضح أن الطريقة المقترحة تحقق أداءً أفضل من النماذج التقليدية للمعالجة المتعددة المراحل وأنها تحسن باستمرار أداء العديد من أساليب تقدير الوضعية المتقدمة على مقاييس الاختبار الشائعة الاستخدام. الرمز متاح في هذا الرابط: \url{https://github.com/mks0601/PoseFix_RELEASE}.