نهج تدريب فعّال للتعرف على الوجه بحجم كبير جدًا

حققت التعرف على الوجوه تقدماً كبيراً في العصر القائم على التعلم العميق بفضل مجموعة البيانات الضخمة للغاية والمعمولة تسمياتها بدقة. ومع ذلك، فإن التدريب على مجموعات البيانات الضخمة يستهلك وقتاً طويلاً ويتطلب موارد هاردويرية كبيرة. ولهذا السبب، أصبح تصميم نهج تدريب فعّال أمراً لا غنى عنه. وتكمن التكاليف الكبيرة في الحوسبة والذاكرة أساساً في الأبعاد التي تصل إلى ملايين الوحدات في طبقة الاتصال الكامل (FC). ولحل هذه المشكلة، نقترح نهجاً تدريبياً جديداً يُسمى "التقسيم الوجهي الأسرع" (F2C)، والذي يخفف من الوقت والتكاليف دون التضحية بالأداء. ويستخدم هذا الأسلوب ما يُعرف بـ "مُخزن الفئات الديناميكي" (DCP) لتخزين وتحديث ميزات الهوية بشكل ديناميكي، ويمكن اعتباره بديلاً لطبقة FC. ويتميز DCP بالكفاءة الزمنية والتكاليفية العالية، نظراً لحجمه الصغير واستقلاله عن جميع هويات الوجوه بالكامل. وقد قمنا بتوثيق أداء F2C المقترح عبر عدة معايير معروفة للوجه ومجموعات بيانات خاصة، وبيّنّا نتائج مماثلة، مع تسريع في الأداء مقارنةً بالأساليب الحديثة القائمة على طبقة FC من حيث دقة التعرف وتكاليف الموارد الهاردويرية. علاوة على ذلك، تم تحسين أداء طريقة العمل من خلال تصميم مُحمّل بيانات ثنائي متكامل، يشمل مُحمّلاً قائماً على الهوية ومُحمّلاً قائماً على المثال، مما يجعل عملية تحديث معلمات DCP أكثر كفاءة.