استراتيجيات وقواعد بيانات التدريب الأولي لتعلم تمثيل الوجه

ما هي أفضل طريقة لتعلم تمثيل وجه عام؟ ركزت الأعمال الحديثة في مجال التعلم العميق في تحليل الوجه على التعلم الإشرافي لأهداف محددة (مثل التعرف على الوجه، تحديد معالم الوجه، إلخ)، ولكنها أغفلت السؤال الشامل حول كيفية العثور على تمثيل للوجه يمكن تكييفه بسهولة مع عدة مهام وقواعد بيانات لتحليل الوجه. من أجل هذا، نقدم الأربعة المساهمات التالية: (أ) نقدم لأول مرة مقاييس تقييم شاملة لتعلم تمثيل الوجه تتكون من خمس مهام مهمة في تحليل الوجه. (ب) نقوم بدراسة منهجية لطريقتين للتعلم على نطاق واسع مطبقتين على الوجوه: التعلم الإشرافي والتعلم غير الإشرافي. وبشكل مهم، نركز تقييماتنا على حالة التعلم القليل الصور (few-shot facial learning). (ج) ندرس الخصائص الهامة لقواعد البيانات التدريبية بما في ذلك حجمها وجودتها (مصنفة، غير مصنفة أو حتى غير منقحة). (د) لإستخلاص استنتاجاتنا، أجرينا عددًا كبيرًا جدًا من التجارب. الاستنتاجان الرئيسيان لدينا هما: (1) يوفر التعلم غير الإشرافي المسبق على البيانات البرية تمامًا وغير المنقحة تحسينات دقيقة وفي بعض الحالات كبيرة جدًا في دقة جميع المهام المتعلقة بالوجه التي تم دراستها. (2) يبدو أن العديد من قواعد البيانات الفيديو الموجودة للوجوه تحتوي على نسبة كبيرة من التكرار. سنقوم بإصدار الكود والنموذج المُدرَّب مسبقًا لتسهيل البحث المستقبلي.