HyperAIHyperAI
منذ 16 أيام

DirectPose: تقدير وضعية متعددة الأشخاص من الطرف إلى الطرف بشكل مباشر

Zhi Tian, Hao Chen, Chunhua Shen
DirectPose: تقدير وضعية متعددة الأشخاص من الطرف إلى الطرف بشكل مباشر
الملخص

نُقدّم أول إطار عمل مباشر من الطرف إلى الطرف لتقدير وضعية أكثر من شخص، يُسمّى DirectPose. مستوحى من أحدث كاشفات الكائنات الخالية من المُعلّقات (anchor-free)، التي تُقدّر مباشرة زاويتي المربع المحيط بالكائن المستهدف، فإن الإطار المقترح يُقدّر مباشرة نقاط المفتاح الخاصة بكل كائن من صورة دخول خام، مما يُلغِي الحاجة إلى عملية تجميع يدويّة في الأساليب السفلية (bottom-up) أو إلى كشف المربعات المحيطة والعمليات المرتبطة بمنطقة الاهتمام (RoI) في الأساليب العلوية (top-down). كما نُقدّم آلية جديدة تُسمّى محاذاة نقاط المفتاح (Keypoint Alignment - KPAlign)، والتي تُعالج الصعوبة الرئيسية: نقص التوافق بين الميزات التلافيفية (convolutional features) والتنبؤات في هذا الإطار المباشر من الطرف إلى الطرف. تُحسّن KPAlign أداء الإطار بشكل كبير مع الحفاظ على إمكانية تدريبه بشكل مباشر من الطرف إلى الطرف. وباستخدام عملية ما بعد المعالجة الوحيدة وهي قمع الحد الأقصى غير المُتداخل (Non-Maximum Suppression - NMS)، يمكن للإطار المقترح اكتشاف نقاط المفتاح الخاصة بأشخاص متعددين، سواء مع أو دون استخدام مربعات محيطة، في عملية واحدة (single shot). تُظهر التجارب أن النموذج المباشر من الطرف إلى الطرف يمكنه تحقيق أداءً تنافسيًا أو أفضل من النماذج القوية السابقة، سواء في الأساليب السفلية أو العلوية. نأمل أن يُقدّم نهجنا المباشر من الطرف إلى الطرف منظورًا جديدًا لمهام تقدير وضعية الإنسان.

DirectPose: تقدير وضعية متعددة الأشخاص من الطرف إلى الطرف بشكل مباشر | أحدث الأوراق البحثية | HyperAI