إلى تقدير سريع ودقيق لوضعية الإنسان من خلال اتصالات تخطي مُنظَّمة لينة

تتناول هذه الورقة موضوع تقدير وضع الإنسان بدقة عالية وكفاءة عالية. وقد أظهرت الدراسات الحديثة القائمة على الشبكات التلافيفية الكاملة (FCNs) نتائج ممتازة في حل هذه المشكلة الصعبة. وعلى الرغم من أن الاتصالات المتبقية داخل الشبكات التلافيفية الكاملة أثبتت كونها حاسمة لتحقيق دقة عالية، فإننا نعيد تحليل هذا الخيار التصميمي في سياق تحسين كل من الدقة والكفاءة مقارنة بالحالة الحالية في المجال. وتحديدًا، نقدم المساهمات التالية: (أ) نقترح اتصالات متعددة بمقابض (gated skip connections) ذات معلمات قابلة للتعلم لكل قناة، لضبط تدفق البيانات لكل قناة ضمن الوحدة داخل الوحدة الكبيرة. (ب) نُقدِّم شبكة هجينة تجمع بين معمارية HourGlass وU-Net، والتي تقلل من عدد الاتصالات الهوية داخل الشبكة وتعزز الأداء ضمن نفس الميزانية المعيارية للنموذج. ويحقق نموذجنا نتائج متقدمة على مستويات البيانات MPII وLSP. علاوةً على ذلك، وبما يقلل من حجم النموذج وتعقيد حساباته بنسبة 3 أضعاف، نُظهر عدم حدوث انخفاض في الأداء مقارنة بالشبكة الأصلية من نوع HourGlass.