PropagationNet: نشر النقاط إلى المنحنيات لتعلم معلومات البنية

لقد دفعت التقنية العميقة الأداء الخاص بخوارزميات توجيه الوجه بشكل كبير. ومع ذلك، نظرًا للتنوع الكبير ونقص العينات، لا يزال يُعتبر مسألة التوجيه في الظروف غير المقيدة، مثل وضعيات الرأس الكبيرة، والتعبيرات المبالغ فيها، والإضاءة غير المنتظمة، مشكلة غير محلولة بالكامل. في هذا البحث، نستعرض الدوافع والأسس الكامنة وراء اقتراحَين لدينا، وهما: وحدة الانتشار (Propagation Module) ووظيفة الخسارة ذات الجناح المركز (Focal Wing Loss)، بهدف معالجة هذه المشكلة. بشكل محدد، نقدّم خوارزمية جديدة لتحديد توجيه الوجه تعتمد على دمج البنية، من خلال تنفيذ تRegression لخريطة الحرارة (heatmap regression) عن طريق نقل خرائط نقاط الوجه (landmark heatmaps) إلى خرائط حرارة الحدود (boundary heatmaps)، والتي توفر معلومات هيكلية لاحقة لتكوين خرائط الانتباه. علاوةً على ذلك، نقترح وظيفة خسارة ذات جناح مركزي (Focal Wing Loss) لاستخراج العينات الصعبة وتعزيزها في ظل الظروف الطبيعية (in-the-wild). كما نستخدم تقنيات من مجالات أخرى، مثل CoordConv وCNN المضاد للتشويش (Anti-aliased CNN)، التي تُعالج مشكلة عدم التحولية (shift-variance) في الشبكات العصبية العميقة (CNN) في سياق توجيه الوجه. عند تنفيذ تجارب واسعة على مجموعات بيانات مختلفة، مثل WFLW و300W وCOFW، تفوقت طريقة لدينا على أحدث الأساليب بفارق ملحوظ. حققت الطريقة المقترحة خطأً متوسطًا بنسبة 4.05% على WFLW، و2.93% على مجموعة 300W الكاملة، و3.71% على COFW.