AID: دفع حدود الأداء لتقدير وضعية الإنسان باستخدام تحسين إسقاط المعلومات

تُعد مؤشرات المظهر والقيود ضرورية بشكل حاسم لتقدير وضعية الإنسان. ومع ذلك، تُظهر معظم الدراسات الحالية اتجاهًا نحو التكيف الزائد مع المؤشرات المرئية وتجاهل المؤشرات القيودية. في هذه الورقة، نقترح طريقة تُسمى "التوسيع من خلال إسقاط المعلومات" (AID) للتحقق من هذا التناقض والتغلب عليه. وبالإضافة إلى كون AID شرطًا مسبقًا لاستغلال إمكاناته بكفاءة، نُقدّم جداول تدريب مخصصة، تم تصميمها من خلال تحليل نمط دالة الخسارة والأداء خلال عملية التدريب من منظور تزويد المعلومات. في التجارب، تُظهر AID كمنهجية غير تعتمد على النموذج (model-agnostic) تحسينًا ملحوظًا لعدة طرق حديثة متقدمة في كلا النموذجين السفلي (bottom-up) والعلوي (top-down)، باستخدام أحجام إدخال مختلفة، وأطر عمل متنوعة، وبنية أساسية (backbones) متفاوتة، ومجموعات تدريب واختبار متنوعة. على مجموعة اختبار COCO الشهيرة لتقدير وضعية الإنسان، تُعزز AID أداء مختلف التكوينات بشكل منتظم بحوالي 0.6 نقطة AP في النموذج العلوي، وبما يصل إلى 1.5 نقطة AP في النموذج السفلي. وعلى مجموعة بيانات أكثر تحدّيًا هي CrowdPose، يكون التحسن أكثر من 1.5 نقطة AP. وبما أن AID نجحت في دفع حدود الأداء في مسألة تقدير وضعية الإنسان بفارق كبير، وتحدد حالة جديدة من التميز (state-of-the-art)، فإننا نأمل أن تصبح AID تكوينًا قياسيًا لتدريب نماذج تقدير وضعية الإنسان. وسيتم إتاحة الشفرة المصدرية للبحث المستقبلي.