HyperAIHyperAI

Command Palette

Search for a command to run...

الشبكة العصبية المتحولة الثنائية المتتابعة للكشف الدقيق عن معالم الوجه

Ziqiang Dang Jianfang Li Lin Liu

الملخص

اكتشاف معالم الوجه هو مشكلة أساسية في رؤية الحاسوب لها تطبيقات عديدة لاحقة. يقدم هذا البحث محددًا جديدًا لمعالم الوجه يستند إلى محولات الرؤية، ويتألف من تصميمين فريدَين: محول الرؤية المزدوج (D-ViT) وروابط القفز الطويلة (LSC). استنادًا إلى الملاحظة أن بُعد القناة في خرائط الميزات يمثل بشكل أساسي القواعد الخطية لمساحة الخريطة الحرارية، نقترح تعلم العلاقات بين هذه القواعد الخطية لنمذجة العلاقات الهندسية الذاتية بين المعالم عبر محول القناة المنقسم (Channel-split ViT). نقوم بدمج هذا المحول المنقسم للقناة في المحول القياسي للرؤية (أي، محول الفضاء المنقسم Spatial-split ViT)، مما يشكل محول الرؤية المزدوج لدينا ليكون الكتل التنبؤية. كما نقترح استخدام روابط القفز الطويلة لنقل ميزات الصورة من المستوى الأدنى إلى جميع الكتل التنبؤية، مما يمنع فقدان المعلومات المفيدة بسبب الإشراف الوسيط. تم إجراء تجارب واسعة لتقييم أداء مقترحنا على المقاييس الشائعة الاستخدام، وهي WFLW وCOFW و300W، مما أظهر أن نموذجنا يتفوق على أفضل النماذج السابقة (SOTAs) في جميع الثلاث مقاييس.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp