تعلم الهرم المميز للتقدير الموضعي للإنسان

تقدير وضعية الإنسان المفصلية هو مهمة أساسية ومعقدة في رؤية الحاسوب. تزداد صعوبة هذه المهمة بشكل خاص عند حدوث تغيرات في حجم أجزاء الجسم البشري نتيجة تغيير زاوية الكاميرا أو التشوه الشديد. رغم أن طرق الهرم تُستخدم على نطاق واسع للتعامل مع التغيرات في الحجم أثناء الاستدلال، فإن تعلم هياكل ميزات الهرمية في شبكات العصبونات التلافيفية العميقة (DCNNs) لا يزال مجالًا قليل البحث. في هذا العمل، نصمم وحدة بقايا الهرم (Pyramid Residual Module - PRMs) لتعزيز ثبات الحجم في شبكات العصبونات التلافيفية العميقة. بناءً على الميزات الإدخال، تقوم الوحدة PRMs بتعلم مرشحات تلافيفية على مستويات مختلفة من الميزات الإدخال، والتي يتم الحصول عليها بمعدلات استذكار مختلفة في شبكة متعددة الفروع. بالإضافة إلى ذلك، لاحظنا أن استخدام الأساليب الموجودة لتثبيت أوزان الشبكات المتعددة الفروع غير مناسب، حيث حققت هذه الشبكات أداءً أفضل من الشبكات البسيطة في العديد من المهام مؤخرًا. لذلك، نقدم اشتقاقًا نظريًا لتوسيع مخطط تثبيت الأوزان الحالي إلى هيكل شبكات متعددة الفروع. نقوم بدراسة طريقتنا على معيارين قياسيين للمعايرة لتقدير وضعية الإنسان. يحصل نهجنا على أفضل النتائج الحالية على كلا المعيارين. الرمز البرمجي متاح على الرابط: https://github.com/bearpaw/PyraNet.