المحاذاة الوجهية المقاومة للإغلاق باستخدام بنية شبكة هرمية غير حساسة للاتجاه

يؤدي مشكلة الاحتجاز (occlusion) إلى تدهور كبير في أداء تحديد المواقع في مهام تطابق الوجه. تتركز معظم الحلول الحالية لهذه المشكلة في ترميز بيانات جديدة معرضة للإغلاق، وإدخال تقديرات للحدود، وبناء نماذج أعمق لتعزيز مرونة الشبكات العصبية. ومع ذلك، لا تزال أداء النماذج يتأثر سلبًا في حالات الإغلاق الشديد (متوسط الإغلاق يتجاوز 50%) نظرًا لفقدان كمية كبيرة من المعلومات السياقية الوجهية. نحن نرى أن استكشاف الشبكات العصبية لتمثيل الهيكل الهرمي للوجه يُعد طريقة أكثر واعدة لمعالجة حالات الإغلاق الشديد. ومن المدهش أن الدراسات الحديثة لم تُخصص جهدًا كبيرًا لتمثيل الهياكل الهرمية للوجه باستخدام الشبكات العصبية. تقدم هذه الورقة بنية شبكة جديدة تُسمى GlomFace، المصممة لتمثيل الهياكل الهرمية للوجه في مواجهة أنواع مختلفة من الإغلاق، مستوحاة من مفهوم التماثل في الوجه بالنسبة للزاوية المرئية. وبشكل محدد، تُقسَّم GlomFace وظيفيًا إلى وحدتين رئيسيتين: الوحدة الهرمية الجزء-الكل، والوحدة الهرمية الكل-الجزء. تُركّز الوحدة الأولى على التقاط الاعتماديات الهرمية بين الأجزاء والكل في الوجه، بهدف كبح معلومات الإغلاق متعددة المقاييس، في حين تُضفي الوحدة الثانية مهارات الاستدلال الهيكلي على الشبكة العصبية من خلال بناء علاقات هرمية بين الكل والجزء بين مكونات الوجه. نتيجة لذلك، تمتلك GlomFace تفسيرًا توافقيًا واضحًا نظرًا لارتباطها المباشر بالهياكل الهرمية للوجه. تُظهر النتائج التجريبية الواسعة أن GlomFace تحقق أداءً مماثلاً للأساليب الرائدة الحالية، وخاصة في الحالات التي تشهد إغلاقًا شديدًا. يمكن الوصول إلى النماذج المستخدمة في هذه الدراسة عبر الرابط التالي: https://github.com/zhuccly/GlomFace-Face-Alignment.