HyperAIHyperAI

Command Palette

Search for a command to run...

PyramidBox: كاشف الوجوه بمساعدة السياق في تصويب واحد

Xu Tang* Daniel K. Du* Zeqiang He Jingtuo Liu†

الملخص

تم دراسة اكتشاف الوجه لسنوات عديدة، وأحد التحديات المتبقية هو اكتشاف الوجوه الصغيرة والمشوهة جزئياً في بيئات غير مراقبة. يقترح هذا البحث مكتشفاً للوجوه بطلقة واحدة مساعداً بالسياق، يُطلق عليه اسم \emph{PyramidBox}، للتعامل مع مشكلة اكتشاف الوجه الصعبة. من خلال ملاحظة أهمية السياق، نحسن استخدام المعلومات السياقية في الجوانب الثلاثة التالية. أولاً، نصمم رابطاً سياقياً جديداً لمراقبة تعلم الخصائص السياقية العليا بطريقة شبه إشرافية، والتي نسميها PyramidAnchors (رابط الأهرامات). ثانياً، نقترح شبكة هرمية للميزات المستوى المنخفض لدمج الميزات السياقية الدلالية المناسبة للمستوى العالي وميزات الوجه المستوى المنخفض معًا، مما يسمح لـ PyramidBox بتوقع الوجوه بمختلف المقاييس في طلقة واحدة. ثالثاً، نقدم بنية حساسة للسياق لزيادة قدرة شبكة التنبؤ على تحسين دقة النتائج النهائية. بالإضافة إلى ذلك، نستخدم طريقة Data-anchor-sampling (عينة الرابط البيانات) لتضخيم العينات التدريبية عبر مقاييس مختلفة، مما يزيد من تنوع بيانات التدريب للوجوه الأصغر حجماً. من خلال استغلال قيمة السياق، حققت PyramidBox أداءً فائقاً بين أفضل التقنيات الحالية على منصتي الاختبار الشائعتين لاكتشاف الوجه FDDB و WIDER FACE. يمكن الحصول على كودنا في PaddlePaddle: \href{https://github.com/PaddlePaddle/models/tree/develop/fluid/face_detection}{\url{https://github.com/PaddlePaddle/models/tree/develop/fluid/face_detection}}.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp