إيفوبوز2D: دفع حدود التقدير الثنائي الأبعاد للوضعية البشرية باستخدام التطور العصبي المُسرّع مع نقل الأوزان

أثبتت عملية بحث البنية العصبية (Neural Architecture Search) فعاليتها العالية في تصميم شبكات عصبية تلافيفية كفاءة، وهي أكثر ملاءمة للنشر على الأجهزة المحمولة مقارنة بالشبكات المصممة يدويًا. بافتراض أن بحث البنية العصبية يمتلك إمكانات كبيرة في تحسين تقدير وضعية الإنسان، نستكشف تطبيق "التطور العصبي" (Neuroevolution)، وهي صيغة من صيغ بحث البنية العصبية مستوحاة من التطور البيولوجي، في تصميم شبكات تقدر وضعية الإنسان ثنائية الأبعاد (2D) لأول مرة. بالإضافة إلى ذلك، نقترح خطة جديدة لنقل الأوزان (weight transfer) تتيح لنا تسريع عملية التطور العصبي بطريقة مرنة. تُنتج طريقتنا تصميمات شبكات أكثر كفاءة ودقة من الشبكات اليدوية المتطورة حاليًا. في الواقع، تُعالج الشبكات المُولَّدة الصور بدوال تفاصيل أعلى باستخدام حسابات أقل مقارنة بالشبكات اليدوية السابقة التي تعمل بدوال تفاصيل أقل، مما يمكّننا من دفع حدود تقدير وضعية الإنسان ثنائي الأبعاد. تحقق الشبكة الأساسية التي صُممت عبر التطور العصبي، والتي نسميها EvoPose2D-S، دقة مماثلة لـ SimpleBaseline، مع سرعة أعلى بنسبة 50% وحجم ملف أصغر بنسبة 12.7 مرة. أما الشبكة الأكبر لدينا، EvoPose2D-L، فقد حققت دقة جديدة على مستوى الحد الأقصى (state-of-the-art) في معيار Microsoft COCO Keypoints، وهي أصغر بنسبة 4.3 مرة من أقرب منافس لها، مع سرعة استنتاج مماثلة. يمكن الوصول إلى الكود المصدري بشكل عام عبر الرابط: https://github.com/wmcnally/evopose2d.