HyperAIHyperAI

Command Palette

Search for a command to run...

بي-إف-فورمر: مُقدِّم تقدير الوضعية

Paschalis Panteleris Antonis Argyros

الملخص

أُظهرت أن معمارية نموذج الرؤية المتغيرة (Vision Transformer) تعمل بكفاءة عالية في مهام تصنيف الصور. تعتمد الجهود المبذولة لحل مهام الرؤية الأكثر تعقيدًا باستخدام النماذج المتغيرة على هياكل تلافيفية (CNN) لاستخراج الميزات. في هذا البحث، نستعرض استخدام معمارية نموذج متغير صرف (أي بدون استخدام هيكل تلافيفي) لمشكلة تقدير وضعية الجسم ثنائي الأبعاد. قمنا بتقييم نوعين من معماريات ViT على مجموعة بيانات COCO، ونُظهر أن استخدام معمارية نموذج متغير من نوع مشفر-فكك (encoder-decoder) يؤدي إلى نتائج من الدرجة الأولى (state-of-the-art) في هذه المشكلة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
بي-إف-فورمر: مُقدِّم تقدير الوضعية | مستندات | HyperAI