TFPose: التقدير المباشر لوضع الإنسان باستخدام المحولات

نُقدِّم إطارًا لتقدير وضع الإنسان يحل هذه المهمة بطريقة الانحدارية. على عكس الطرق السابقة القائمة على الانحدار، التي تُعاني غالبًا من التأخر مقارنة بالطرق الأحدث، نُصِف مسألة تقدير الوضع كمشكلة تنبؤ بالتسلسل، والتي يمكن حلها بشكل فعّال باستخدام نماذج المحولات (Transformers). يتميز إطارنا بالبساطة والوضوح، حيث يتجنّب العيوب المتأصلة في طرق تقدير الوضع القائمة على خريطة الحرارة (Heatmap). علاوةً على ذلك، وبفضل آلية الانتباه (Attention Mechanism) المُدمجة في المحولات، يُمكن لإنجازنا أن يُركّز تلقائيًا على الميزات الأكثر صلة بالنقاط المفتاحية المستهدفة، مما يُعالج إلى حد كبير مشكلة عدم التوافق بين الميزات التي تواجهها الطرق السابقة القائمة على الانحدار، ويُحسّن الأداء بشكل كبير. ومن المهم الإشارة إلى أن إطارنا يمكنه امتلاك ميزة طبيعية في استغلال العلاقة الهيكلية بين النقاط المفتاحية. وقد أظهرت التجارب على مجموعتي بيانات MS-COCO وMPII أن طريقة我们的 يمكنها تحسين الأداء المُتَقدِّم للطرق القائمة على الانحدار بشكل ملحوظ، وأن أداؤها يُنافس أفضل الطرق القائمة على خريطة الحرارة.