خسارة الجناح للتصويب الدقيق لنقاط الوجه باستخدام الشبكات العصبية التلافيفية

نقدم دالة خسارة جديدة تُسمى دالة الخسارة الجناحية (Wing Loss) لتحسين تحديد معالم الوجه بشكل متين باستخدام شبكات العصبونات التلافيفية (CNNs). أولاً، نقوم بمقارنة وتحليل مختلف دوال الخسارة بما في ذلك L2، L1 والـ L1 الناعمة. تشير تحليلات هذه دوال الخسارة إلى أنه يجب التركيز أكثر على الأخطاء الصغيرة والمتوسطة المدى عند تدريب نموذج تحديد المعالم المستند إلى الشبكات العصبونية التلافيفية. لهذا الغرض، قمنا بتصميم دالة خسارة قطعية. تقوم الدالة الجديدة بتعزيز تأثير الأخطاء من الفاصلة (-w, w) عن طريق التحويل من دالة الخسارة L1 إلى دالة لوغاريتمية معدلة.لمعالجة مشكلة قلة تمثيل العينات ذات دوران الرأس الكبير خارج الطائرة في مجموعة التدريب، نقترح استراتيجية تعزيز بسيطة ولكن فعّالة تُعرف بالموازنة القائمة على الوضع (Pose-based Data Balancing). وبشكل خاص، نتعامل مع مشكلة عدم توازن البيانات من خلال مضاعفة عينات التدريب الأقل تمثيلاً وإرباكها بإدخال دوران صورة عشوائي، وترجمة مربع الحدود، وغيرها من أساليب زيادة البيانات. أخيراً، يتم توسيع النهج المقترح لإنشاء إطار عمل ذو مرحلتين لتحديد معالم الوجه بشكل متين. تظهر النتائج التجريبية التي تم الحصول عليها على مجموعتي بيانات AFLW و 300W فوائد دالة الخسارة الجناحية (Wing Loss)، وتثبت تفوق النهج المقترح على الأساليب الأكثر حداثة.