HyperAIHyperAI

Command Palette

Search for a command to run...

S3^33FD: كاشف الوجوه ذو الإطلاق الواحد والمقياس الثابت

Shifeng Zhang Xiangyu Zhu Zhen Lei* Hailin Shi Xiaobo Wang Stan Z. Li

الملخص

يقدم هذا البحث نظامًا لكشف الوجوه في الوقت الفعلي، يُسمى "S3^33FD" أو "نظام الكشف عن الوجوه ذو الإطلاق الواحد والمرونة الحجمية" (Single Shot Scale-invariant Face Detector)، والذي يتميز بأدائه المتفوق في كشف الوجوه بمختلف أحجامها باستخدام شبكة عصبية عميقة واحدة، خاصة بالنسبة للوجوه الصغيرة. تحديدًا، نحاول حل المشكلة الشائعة التي تتمثل في تدهور أداء الكاشفات القائمة على الأهداف بشكل كبير عند تصغير الأشياء. نسهم في الجوانب الثلاثة التالية: 1) اقتراح إطار عمل متكافئ الحجم للكشف عن الوجوه لمعالجة مختلف أحجام الوجوه بفعالية. نقوم بتوزيع الأهداف على نطاق واسع من الطبقات لضمان حصول جميع أحجام الوجوه على خصائص كافية للكشف عنها. بالإضافة إلى ذلك، نصمم أحجام الأهداف بناءً على المجال الاستقبالي الفعال ومبدأ النسبة المتساوية المقترح؛ 2) تحسين معدل استدعاء الوجوه الصغيرة من خلال استراتيجية مطابقة الأهداف تعويض الحجم؛ 3) تقليل معدل الإشارات الخاطئة للوجوه الصغيرة عبر استخدام تصنيف الخلفية الأقصى (max-out background label). نتيجة لذلك، يحقق طريقنا أداءً رائدًا في الكشف عن الوجوه على جميع مقاييس الكشف الشائعة، بما في ذلك مجموعات البيانات AFW و PASCAL face و FDDB و WIDER FACE، ويمكنه العمل بمعدل 36 صورة في الثانية على بطاقة الرسومات Nvidia Titan X (Pascal) لصور ذات دقة VGA.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp