HyperAIHyperAI

Command Palette

Search for a command to run...

DirectPose: تقدير وضعية متعددة الأشخاص من الطرف إلى الطرف بشكل مباشر

Zhi Tian Hao Chen Chunhua Shen

الملخص

نُقدّم أول إطار عمل مباشر من الطرف إلى الطرف لتقدير وضعية أكثر من شخص، يُسمّى DirectPose. مستوحى من أحدث كاشفات الكائنات الخالية من المُعلّقات (anchor-free)، التي تُقدّر مباشرة زاويتي المربع المحيط بالكائن المستهدف، فإن الإطار المقترح يُقدّر مباشرة نقاط المفتاح الخاصة بكل كائن من صورة دخول خام، مما يُلغِي الحاجة إلى عملية تجميع يدويّة في الأساليب السفلية (bottom-up) أو إلى كشف المربعات المحيطة والعمليات المرتبطة بمنطقة الاهتمام (RoI) في الأساليب العلوية (top-down). كما نُقدّم آلية جديدة تُسمّى محاذاة نقاط المفتاح (Keypoint Alignment - KPAlign)، والتي تُعالج الصعوبة الرئيسية: نقص التوافق بين الميزات التلافيفية (convolutional features) والتنبؤات في هذا الإطار المباشر من الطرف إلى الطرف. تُحسّن KPAlign أداء الإطار بشكل كبير مع الحفاظ على إمكانية تدريبه بشكل مباشر من الطرف إلى الطرف. وباستخدام عملية ما بعد المعالجة الوحيدة وهي قمع الحد الأقصى غير المُتداخل (Non-Maximum Suppression - NMS)، يمكن للإطار المقترح اكتشاف نقاط المفتاح الخاصة بأشخاص متعددين، سواء مع أو دون استخدام مربعات محيطة، في عملية واحدة (single shot). تُظهر التجارب أن النموذج المباشر من الطرف إلى الطرف يمكنه تحقيق أداءً تنافسيًا أو أفضل من النماذج القوية السابقة، سواء في الأساليب السفلية أو العلوية. نأمل أن يُقدّم نهجنا المباشر من الطرف إلى الطرف منظورًا جديدًا لمهام تقدير وضعية الإنسان.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp