EfficientPose: تقدير وضعية الشخص الفردي القابل للتوسع بكفاءة

يُسهّل التقدير أحادي الشخص لوضعية الإنسان التحليل الحركي دون استخدام علامات في مجال الرياضة، وكذلك في التطبيقات السريرية. ومع ذلك، لا تلبّي النماذج المتطورة حاليًا لتقدير وضعية الإنسان متطلبات التطبيقات الحقيقية. وقد أدى الانتشار الواسع لتقنيات التعلم العميق إلى تطوير العديد من النماذج المتقدمة. لكن مع التقدم في هذا المجال، ظهرت أيضًا نماذج أكثر تعقيدًا وفعالية منخفضة، مما أدى إلى زيادة هائلة في متطلبات الحوسبة. وللتعامل مع تحديات التعقيد والكفاءة هذه، نقترح بنية جديدة لشبكة عصبية تلافيفية تُسمى EfficientPose، والتي تُستفيد من نماذج EfficientNets المطروحة حديثًا لتقديم تقدير فعّال وقابل للتوسع لوضعية الإنسان في حالة الأشخاص الأفراد. تُشكّل EfficientPose عائلة من النماذج التي تستفيد من مُستخرج ميزات متعددة المقاييس الفعّالة، ووحدات كشف فعّالة من الناحية الحسابية تستخدم التلافيف المقلوبة المتنقلة (mobile inverted bottleneck convolutions)، مع الحفاظ على تحسين دقة تكوينات الوضعية في الوقت نفسه. وبفضل تعقيدها المنخفض وكفاءتها العالية، تُمكّن EfficientPose من تطبيقها في البيئات الواقعية على الأجهزة الحافة من خلال تقليل حجم الذاكرة المستخدمة والتكلفة الحسابية. تُظهر نتائج تجاربنا، باستخدام معيار MPII الصعب لتقدير وضعية الشخص الواحد، أن نماذج EfficientPose المقترحة تتفوّق بشكل كبير على النموذج الشائع OpenPose من حيث الدقة والكفاءة الحسابية. وبشكل خاص، حقق أفضل نموذج لدينا دقة رائدة في مجال تقدير وضعية الشخص الواحد على معيار MPII، باستخدام شبكات تلافيفية ذات تعقيد منخفض.