HyperAIHyperAI
منذ 11 أيام

بوسيور: استرجاع مباشر لوضع الإنسان باستخدام المحولات

Weian Mao, Yongtao Ge, Chunhua Shen, Zhi Tian, Xinlong Wang, Zhibin Wang, Anton van den Hengel
بوسيور: استرجاع مباشر لوضع الإنسان باستخدام المحولات
الملخص

نُقدّم نهجًا مباشرًا يعتمد على الانحدار لتقدير وضعية الإنسان ثنائية الأبعاد من صور واحدة. نُصيغ المشكلة كمهمة تنبؤ بالتسلسل، والتي نحلها باستخدام شبكة محولات (Transformer). تقوم هذه الشبكة بتعلم خريطة انحدار مباشرة من الصور إلى إحداثيات النقاط الأساسية، دون اللجوء إلى تمثيلات وسيطة مثل خرائط الحرارة (heatmaps). يُقلل هذا النهج من الكثير من التعقيد المرتبط بالطرق القائمة على خرائط الحرارة. ولتجاوز مشكلة عدم التوافق بين السمات في الطرق السابقة القائمة على الانحدار، نقترح آلية انتباه تُعدّ تلقائيًا على السمات الأكثر صلة بالنقاط الأساسية المستهدفة، مما يُحسّن بشكل كبير من الدقة. وبشكل مهم، فإن إطار عملنا قابِل للتمييز من الطرفين (end-to-end differentiable)، ويتعلم بشكل طبيعي الاستفادة من الاعتماديات بين النقاط الأساسية. أظهرت التجارب على مجموعتي بيانات MS-COCO وMPII، اللتين تُعدّان من أبرز مجموعات بيانات تقدير الوضعية، أن طريقتنا تتفوّق بشكل ملحوظ على أحدث الطرق القائمة على الانحدار في تقدير الوضعية. وبشكل أكثر بروزًا، فإن هذه هي أول طريقة قائمة على الانحدار تُقدّم أداءً يُنافس أفضل الطرق القائمة على خرائط الحرارة في تقدير الوضعية.

بوسيور: استرجاع مباشر لوضع الإنسان باستخدام المحولات | أحدث الأوراق البحثية | HyperAI