إعادة توزيع العينات والحساب للكشف الفعّال عن الوجه

على الرغم من التقدم الكبير المحرز في كشف الوجه دون تحكم، ما يزال كشف الوجه الفعّال بتكاليف حوسبة منخفضة ودقة عالية يمثل تحديًا مفتوحًا. في هذه الورقة، نشير إلى أن استراتيجيات أخذ العينات من بيانات التدريب واستراتيجيات توزيع الحوسبة هما المفتاح للكشف الفعّال والدقيق عن الوجه. مستوحين من هذه الملاحظات، نقدم طريقتين بسيطتين ولكن فعّالتين: (1) إعادة توزيع العينات (SR)، التي تُضاعف العينات التدريبية للمراتب الأكثر حاجة إليها، بناءً على إحصائيات مجموعات البيانات القياسية؛ و(2) إعادة توزيع الحوسبة (CR)، التي تعيد توزيع الحوسبة بين جزء الأساس (backbone) وجزء الوصل (neck) وجزء الرأس (head) في النموذج، وذلك باستخدام منهجية بحث دقيقة ومحددة مسبقًا. أظهرت التجارب الواسعة التي أجريت على مجموعة WIDER FACE تفوقًا متميزًا في التوازن بين الكفاءة والدقة لعائلة \scrfd عبر نطاق واسع من بيئات الحوسبة. وبشكل خاص، تفوقت النسخة \scrfdf{34} على أفضل منافس لها، أي TinaFace، بنسبة 3.86% (AP على مجموعة الصعوبة العالية)، مع تسريع يزيد عن 3 أضعاف على وحدات معالجة الرسومات (GPU) عند استخدام صور ذات دقة VGA. كما نُشر الكود الخاص بنا لتسهيل الأبحاث المستقبلية.