Command Palette
Search for a command to run...
خصائص الوجه باستخدام التعلم العميق في البيئة البرية
خصائص الوجه باستخدام التعلم العميق في البيئة البرية
Liu Ziwei Luo Ping Wang Xiaogang Tang Xiaoou
الملخص
تُعدّ توقع صفات الوجه في البيئات الطبيعية (الحرة) تحديًا كبيرًا نظرًا لتنوع الوجوه المعقد الذي يواجهه النظام. نقترح إطارًا جديدًا للتعلم العميق لتنبؤ صفات الوجه في البيئات الطبيعية، يعتمد على تسلسل اثنين من الشبكات العصبية التلافيفية (CNN)، وهما LNet وANet، حيث يتم ضبطهما بشكل مشترك باستخدام علامات الصفة، لكن بتدريب مسبق مختلف لكل منهما. يُدرَّب LNet مسبقًا على فئات كثيرة من الكائنات العامة لغرض تحديد موقع الوجه، بينما يُدرَّب ANet مسبقًا على هويات وجهية ضخمة لغرض التنبؤ بالصفات. يتفوق هذا الإطار على أحدث النماذج التقنية بفارق كبير، كما يكشف عن حقائق قيمة حول تعلّم تمثيل الوجه.(1) يوضح كيف يمكن تحسين أداء تحديد موقع الوجه (LNet) والتنبؤ بالصفات (ANet) من خلال استراتيجيات تدريب مسبق مختلفة.(2) يُظهر أن التصاميم (المرشحات) الخاصة بـ LNet، رغم أنها تم ضبطها فقط باستخدام علامات صفة على مستوى الصورة (image-level tags)، فإن خرائط استجابتها على الصور الكاملة تمتلك إشارة قوية لمواقع الوجوه. وهذا يمكّن من تدريب LNet على تحديد موقع الوجه باستخدام فقط علامات على مستوى الصورة، دون الحاجة إلى صناديق حدودية للوجوه أو نقاط مميزة (landmarks)، وهي متطلبات مطلوبة في جميع الدراسات السابقة المتعلقة بالتعرف على الصفة.(3) كما يُظهر أن العصبونات الخفية عالية المستوى في ANet تقوم تلقائيًا باكتشاف مفاهيم معنوية بعد التدريب المسبق على هويات وجهية ضخمة، وتُصبح هذه المفاهيم أكثر ثراءً بشكل ملحوظ بعد الضبط الدقيق باستخدام علامات الصفة. ويمكن تفسير كل صفة بشكل جيد باستخدام تركيب خطي نادر (sparse linear combination) لهذه المفاهيم.