HyperAIHyperAI

Command Palette

Search for a command to run...

TransPose: التحديد الدقيق للنقاط الرئيسية من خلال المُحَوِّل

Sen Yang Zhibin Quan Mu Nie Wankou Yang

الملخص

رغم التقدم المذهل الذي حققته النماذج القائمة على الشبكات العصبية التلافيفية (CNN) في تقدير وضعية الإنسان، لا يزال غير واضح ما هي الاعتماديات المكانية التي تُمكّنها من تحديد المواقع الرئيسية (keypoints). في هذه الدراسة، نقترح نموذجًا يُسمى \textbf{TransPose}، الذي يُدخل معمارية Transformer لتقدير وضعية الإنسان. تُمكّن طبقات الانتباه المُبنية في Transformer نموذجنا من التقاط العلاقات على مدى طويل بكفاءة، كما تُتيح لنا الكشف عن الاعتماديات التي تعتمد عليها المواقع الرئيسية المُتنبأ بها. لتقدير خرائط الحرارة الخاصة بالمواقع الرئيسية، تعمل آخر طبقة انتباه كمُجمّع، حيث تجمع المساهمات من المؤشرات المرئية وتشكل المواقع القصوى للمواقع الرئيسية. يتوافق هذا النهج القائم على خرائط الحرارة من خلال Transformer مع مبدأ تحسين التنشيط~\cite{erhan2009visualizing}. كما أن الاعتماديات المُكشفة تكون محددة للصورة ودقيقة التفاصيل، وتُقدّم أدلة حول كيفية تعامل النموذج مع الحالات الخاصة، مثل الازدحام أو التغطية الجزئية. أظهرت التجارب أن TransPose تحقق 75.8 AP و75.0 AP على مجموعتي التحقق والاختبار (test-dev) من مجموعة بيانات COCO، مع كونها أخف وزنًا وأسرع من الهياكل الرئيسية القائمة على الشبكات العصبية التلافيفية. كما يُظهر نموذج TransPose أداءً متميزًا في تطبيقه على معيار MPII، حيث يحقق أداءً متفوقًا على مجموعة الاختبار عند التكييف الدقيق (fine-tuning) بتكلفة تدريب صغيرة. تم إتاحة الكود والنماذج المُدرّبة مسبقًا للجمهور\footnote{\url{https://github.com/yangsenius/TransPose}}.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp