SymFace: خسارة تناظر وجه إضافية للتعرف العميق على الوجه

خلال العقد الماضي، شهد تطوير خوارزميات التعرف على الوجه تقدماً مستمراً بفضل استخدام أساليب التعلم الآلي المتقدمة. يُعدّ الدور الذي تلعبه دالة الخسارة محورياً في معالجة مشكلات التحقق من الهوية الوجهية، حيث تُعدّ عاملاً مُحَوِّلاً للوضع. وقد ركّزت هذه الدوال بشكل رئيسي على استكشاف التباينات داخل الفئة (intra-class) أو بين الفئات (inter-class). وتستعرض هذه الدراسة الظاهرة الطبيعية للتناظر الوجهي في سياق مشكلة التحقق من الهوية الوجهية. وقد استُخدم التناظر بين نصف الوجه الأيسر ونصف الوجه الأيمن على نطاق واسع في مجالات بحثية متعددة خلال العقود الأخيرة. وتُطبّق هذه الورقة هذا النهج البسيط بحكمة من خلال تقسيم صورة الوجه عمودياً إلى نصفين. وبافتراض أن الظاهرة الطبيعية للتناظر الوجهي يمكن أن تعزز من منهجية التحقق من الهوية الوجهية، فإننا نفترض أن المتجهين المُخرَجين (embedding vectors) الناتجين عن التقسيم يجب أن يُقَرَّبا من بعضهما البعض في فضاء المتجهات المُخرَجة. مستوحاة من هذا المفهوم، نُعاقِب الشبكة بناءً على الفرق بين متجهات التماثل للصورة المُقسَّمة. تمتلك دالة الخسارة المتناظرة إمكانية تقليل الخصائص غير المتناظرة الصغيرة الناتجة عن التعبيرات الوجهية أو ظروف الإضاءة المختلفة، وبالتالي تُعزز بشكل كبير التباين بين الفئات (inter-class variance)، مما يؤدي إلى توليد تمثيلات وجوه أكثر موثوقية. وتُسهم هذه الدالة في تفوق أي شبكة على أداءها الأساسي (baseline) في جميع المعمارية والتكوينات الحالية للشبكات، ما يمكّننا من تحقيق نتائج من نوع "أفضل ما هو موجود حالياً" (SoTA).