ASFD: كاشف الوجه التلقائي والقابل للتوسع

بالإضافة إلى الكاشفات الحالية القائمة على المقياس المتعدد، أظهرت وحدات تجميع وتعزيز الميزات (FAE) تحسينات أداء متفوقة في كاشفات الكائنات الحديثة. ومع ذلك، تُظهر هذه الوحدات المُصممة يدويًا تحسينات غير متسقة في كشف الوجه، وهو ما يعود أساسًا إلى الفرق الكبير في توزيع البيانات بين مجموعة التدريب (COCO) ومجموعة التطبيق (WIDER Face). ولحل هذه المشكلة، قمنا بتحليل جوهري لتأثير توزيع البيانات، ونتيجة لذلك اقترحنا البحث عن بنية فعّالة لوحدة FAE، تُسمى AutoFAE، باستخدام طريقة بحث معمارية قابلة للتفاضل، والتي تتفوق على جميع الوحدات الحالية لـ FAE في كشف الوجه بفارق ملحوظ. وباستخدام البنية المُستخرجة AutoFAE مع المحركات الحالية، تم بناء شبكة فائقة (supernet) وتدريبها لاحقًا، مما يسمح بتحصيل عائلة من الكاشفات تلقائيًا تحت قيود مختلفة على التعقيد. أظهرت التجارب الواسعة التي أُجريت على معايير شهيرة، مثل WIDER Face وFDDB، أداءً متميزًا من حيث التوازن بين الأداء والكفاءة لعائلة الكاشف التلقائي والقابل للتوسع (ASFD) المقترحة. وبشكل خاص، تفوقت النسخة القوية ASFD-D6 على أفضل منافس لها بقيمة AP تبلغ 96.7/96.2/92.1 على اختبار WIDER Face، في حين أن النسخة الخفيفة ASFD-D0 تستهلك حوالي 3.1 مللي ثانية فقط، أي أكثر من 320 إطارًا في الثانية، على وحدة معالجة الرسومات V100 عند استخدام صور بدقة VGA.