خسارة مساعدة قائمة على الترانسفورمر للتعرف على الوجه عبر التغيرات العمرية

يُعدّ التقدم في العمر تحديًا كبيرًا في مجال التعرف على الوجه، حيث يمكن أن تؤدي التغيرات في نسيج الجلد ولونه إلى تحوّلات في الملامح الوجهية مع مرور الوقت، مما يجعل من الصعب بشكل خاص مقارنة صور نفس الفرد تم التقاطها بعد سنوات، مثل الحالات التي تتطلب التعرف على المدى الطويل. تمتلك شبكات الترانسفورمر قدرة قوية على الحفاظ على العلاقات المكانية التسلسلية الناتجة عن تأثيرات التقدم في العمر. تقدم هذه الورقة تقنية لتقييم الخسارة تعتمد على استخدام شبكة ترانسفورمر كخسارة إضافية في مجال التعرف على الوجه. عادةً ما تأخذ دالة الخسارة القياسية كمدخلاتها التضمين النهائي للهيكل الرئيسي المبني على الشبكة العصبية التلافيفية (CNN). أما هنا، فيتم استخدام خسارة ترانسفورمر-مقياس، وهي نهج مدمج يدمج بين خسارة الترانسفورمر وخسارة المقياس. يهدف هذا البحث إلى تحليل سلوك الترانسفورمر عند تطبيقه على مخرجات التلافيف عندما يتم تنظيم نتيجة الشبكة (CNN) في متجه تسلسلي. تمتلك هذه المتجهات التسلسلية إمكانية التغلب على التغيرات في النسيج أو البنية الإقليمية، مثل التجاعيد أو ترهل الجلد الناتجة عن التقدم في العمر. يستقبل معالج الترانسفورمر مدخلاته من متجهات سياقية تم استخلاصها من الطبقة التلافيفية النهائية للشبكة. يمكن للخصائص المُتعلّمة أن تكون أكثر مقاومة للعمر، مما يكمل القوة التمييزية للتمثيل الناتج عن دالة الخسارة القياسية. وباستخدام هذه التقنية، نستخدم خسارة الترانسفورمر مع مختلف دوال الخسارة المعيارية الأساسية لتقييم تأثير الدوال المدمجة للخسارة. ونلاحظ أن هذا التكوين يمكّن الشبكة من تحقيق نتائج متفوقة (SoTA) على مجموعتي بيانات LFW والبيانات المُتغيرة مع العمر (CA-LFW وAgeDB). يوسع هذا البحث دور شبكات الترانسفورمر في مجال الرؤية الحاسوبية، ويفتح آفاقًا جديدة لاستكشاف استخدام الترانسفورمر كدالة خسارة.