HyperAIHyperAI
منذ 17 أيام

AGRNet: التعلم والاستدلال التمثيلي الرسومي التكيفي لتحليل الوجه

Gusi Te, Wei Hu, Yinglu Liu, Hailin Shi, Tao Mei
AGRNet: التعلم والاستدلال التمثيلي الرسومي التكيفي لتحليل الوجه
الملخص

تُستخلص تحليل الوجه (Face parsing) تسميةً للبكسل لكل مكون وجهي، وهو ما جذب اهتمامًا كبيرًا مؤخرًا. وقد أظهرت الطرق السابقة نجاحها في تحليل الوجه، ولكنها تتجاهل العلاقات المتبادلة بين المكونات الوجهية. في الحقيقة، تمثل العلاقات بين المكونات مؤشرًا حاسمًا في التمييز بين البكسلات الغامضة داخل المنطقة الوجهية. ولحل هذه المشكلة، نقترح نموذجًا لتعلم وتحليل تمثيل الرسم البياني التكيفي للمكونات الوجهية، بهدف تعلُّم رؤوس تمثيلية تصف كل مكون، واستغلال العلاقات بين المكونات، وبالتالي تحقيق نتائج تحليل دقيقة في مواجهة الغموض. وبشكل خاص، نُصمم طريقة تجريد رسم بياني تكيفية وقابلة للتفاضل لتمثيل المكونات على الرسم البياني من خلال عملية تحويل من بكسل إلى رأس، وذلك تحت شرط بدء مسبق يعتمد على خريطة تحليل مُقدَّرة، حيث يتم تجميع ميزات البكسلات ضمن منطقة وجهية معينة على رأس واحد. علاوةً على ذلك، نُدرج بشكل صريح حافة الصورة كمعلومة أولية في النموذج، مما يساعد في التمييز بين البكسلات الواقعة على الحواف والبُكسلات غير الواقعة عليها أثناء عملية التحويل، وبالتالي تحقيق نتائج تحليل محسنة على طول الحواف. ثم، يتعلم النموذج ويحلل العلاقات بين المكونات من خلال تبادل المعلومات عبر الرؤوس على الرسم البياني. وأخيرًا، تُعاد ميزات الرؤوس المُحسَّنة إلى الشبكة البكسلية لتنبؤ خريطة التحليل النهائية. ولتدريب النموذج، نقترح خسارة تمييزية (discriminative loss) تُعاقب على المسافات الصغيرة بين الرؤوس في الفضاء المميزات، مما يؤدي إلى رؤوس مميزة ذات دلالات قوية. أظهرت النتائج التجريبية أداءً متفوقًا للنموذج المقترح على عدة مجموعات بيانات لتحليل الوجه، إلى جانب التحقق من قابلية التعميم عبر تطبيقه على مهمة تحليل الإنسان، مما يؤكد مرونة النموذج.