عندما تلتقي التعرف على الوجه المستقل عن العمر بتركيب عمر الوجه: إطار للتعلم متعدد المهام

للتقليل من تأثير التباين العمري في التعرف على الوجه، اعتمد العمل السابق إما على استخراج الخصائص المميزة المتعلقة بالهوية من خلال تقليل الارتباط بين خصائص الهوية والعمر، وهي الطريقة المعروفة باسم التعرف على الوجه المستقل عن العمر (AIFR)، أو على إزالة التباين العمري بتحويل وجوه مجموعات الأعمار المختلفة إلى مجموعة عمرية واحدة، وهي الطريقة المعروفة باسم التركيب العمري للوجه (FAS)؛ ومع ذلك، فإن الأولى تعاني من نقص النتائج البصرية لتفسير النموذج بينما تعاني الثانية من تشوهات تؤثر سلبًا على التعرف اللاحق. لذلك، تقترح هذه الورقة إطارًا متعدد المهام موحدًا لمعالجة هاتين المهمتين معًا، يُطلق عليه MTLFace، والذي يمكنه تعلم تمثيل الهوية المستقل عن العمر مع تحقيق تركيب وجه مرضٍ. بشكل خاص، نقوم أولاً بتفكيك الخاصية المختلطة للوجه إلى مكونين غير مرتبطين - الخاصية المتعلقة بالهوية والخاصية المتعلقة بالعمر - عبر آلية الانتباه (attention mechanism)، ثم نفصل هذين المكونين باستخدام التدريب المتعدد المهام والتكيف المستمر للمجال. بخلاف الترميز التقليدي الواحد الساخن (one-hot encoding) الذي يحقق FAS على مستوى المجموعة، نقترح وحدة مشروطة بهوية جديدة لتحقيق FAS على مستوى الهوية، باستخدام استراتيجية مشاركة الأوزان لتحسين سلاسة العمر للوجوه المركبة. بالإضافة إلى ذلك، جمعنا وأطلقنا مجموعة بيانات كبيرة للوجوه عبر الأعمار تحتوي على شروحات العمر والجنس لدفع تطور AIFR وFAS. أظهرت التجارب الواسعة التي أجريت على خمسة مجموعات بيانات مقاييس للتعرف على الوجه عبر الأعمار الأداء الفائق لمطروحنا MTLFace مقارنة بالطرق الرائدة الحالية لأجل AIFR وFAS. قمنا أيضًا بتحقق MTLFace في مجموعتي بيانات شائعتين للتعرف العام على الوجه، مما أظهر أداءً تنافسيًا للتعرف على الوجه في البيئات الحقيقية. يمكن الوصول إلى الكود المصدر ومجموعة البيانات عبر الرابط: \url{https://github.com/Hzzone/MTLFace}.