HyperAIHyperAI
منذ 17 أيام

المحاذاة الوجهية باستخدام الشبكة العصبية العميقة الكثافة النواة

{ Qiang Ji, Hui Su, Lisha Chen}
المحاذاة الوجهية باستخدام الشبكة العصبية العميقة الكثافة النواة
الملخص

تحقيق الشبكات العصبية العميقة أداءً جيدًا في العديد من مشكلات الرؤية الحاسوبية مثل محاذاة الوجه. ومع ذلك، عندما تكون الصورة المُختبرة صعبة بسبب ضعف الدقة، أو الازدحام، أو الهجمات المعاكسة، فإن دقة الشبكة العصبية العميقة تنخفض بشكل كبير. لذلك، من المهم تقييم عدم اليقين في توقعاتها. تُستخدم عادةً الشبكات العصبية الاحتمالية التي تعتمد على التوزيع الغاوسي على الهدف لتقييم عدم اليقين في المشكلات الانحدارية. لكن في المشكلات الواقعية، خاصة في مهام الرؤية الحاسوبية، يكون افتراض التوزيع الغاوسي قويًا جدًا. ولنمذجة توزيعات أكثر عمومية، مثل التوزيعات متعددة القمم أو غير المتماثلة، نقترح تطوير شبكة عصبية عميقة تعتمد على كثافة النواة (Kernel Density). وبشكل خاص، في محاذاة الوجه، نُعدِّل شبكة العصابة (hourglass neural network) من أحدث الأدوات لتصبح إطارًا للشبكة العصبية الاحتمالية، حيث يكون مخرجها هو خريطة احتمالية المواقع المميزة (landmark probability map). وتدرب النموذج من خلال تحسين الاحتمال اللوغاريتمي الشرطي. وللاستفادة من خريطة الاحتمال الناتجة، نوسع النموذج ليصبح متعدد المراحل، بحيث يمكن لخرائط "اللوغيت" (logits map) من المرحلة السابقة أن تُدخل إلى المرحلة التالية، بهدف تحسين دقة كشف المواقع المميزة تدريجيًا. أظهرت التجارب الواسعة على مجموعات بيانات معيارية، مقارنةً بأساليب التعلم العميق الأحدث غير المقيدة، أن الشبكة المقترحة التي تعتمد على كثافة النواة تحقق أداءً مماثلًا أو أفضل من حيث دقة التوقعات. كما تقدم تقديرًا لعدم اليقين العشوائي (aleatoric uncertainty) في التوقعات.