تحليل دقيق للصورة الوجهية بسرعة الوقت الفعلي
في هذه الورقة، نقترح مخطط تصميم لشبكات التعلم العميق في مهمة تحليل الوجه، والذي يُظهر دقة متميزة وسرعة استنتاج في الزمن الحقيقي. من خلال تحليل الفروق بين مهمة تحليل الصور العامة ومهمة تحليل الوجه، نعيد النظر أولاً في بنية الشبكة التلافيفية الكاملة التقليدية (FCN) ونُحسّنها لتتناسب مع الخصائص الفريدة لمهام تحليل الوجه. وبخاصة، نُقدّم مفهوم "مجال الاستقبال المُعدّل" (Normalized Receptive Field)، الذي يُوفّر رؤى أعمق في تصميم الشبكة. ثم، نُقدّم دالة خسارة جديدة تُسمّى "دالة الخسارة السياقية الإحصائية" (Statistical Contextual Loss)، التي تدمج معلومات سياقية أكثر غنىً وتنظم الميزات أثناء التدريب. ولتعزيز تسريع النموذج بشكل أكبر، نقترح خطة استخلاص شبه مراقبة (Semi-supervised Distillation) تُحول المعرفة المكتسبة بكفاءة إلى شبكة أخف وزنًا. وأظهرت التجارب الواسعة على مجموعتي بيانات LFW وHelen تفوقًا ملحوظًا للمخطط التصميمي الجديد من حيث الكفاءة والفعالية.