HyperAIHyperAI
منذ 2 أشهر

شبكات U-Net الكثيفة المكدسة مع محولين مزدوجين لضبط الوجه بشكل متين

Jia Guo; Jiankang Deng; Niannan Xue; Stefanos Zafeiriou
شبكات U-Net الكثيفة المكدسة مع محولين مزدوجين لضبط الوجه بشكل متين
الملخص

تحديد معالم الوجه في الصور الملتقطة في البيئة الحقيقية هو مشكلة مهمة وصعبة. يدور أحدث ما توصلت إليه التقنيات حول أنواع معينة من شبكات العصبونات التلافيفية العميقة (DCNNs) مثل شبكات U-Nets المتراكمة وشبكات Hourglass. في هذا البحث، نقترح بشكل مبتكر استخدام شبكات U-Nets الكثيفة المتراكمة لهذه المهمة. صممنا هيكلية شبكة جديدة لدمج المقاييس ووحدة بناء لدمج القنوات بهدف تحسين قدرة النموذج دون التضحية بالتعقيد الحاسوبي وحجم النموذج. بمساعدة التحولات المرنة داخل شبكات U-Nets الكثيفة المتراكمة وخسارة متماسكة للتحولات الخارجية، يتمكن نموذجنا من تحقيق ثبات فضائي أمام صور الوجوه المدخلة بمختلف الأشكال. تم إجراء تجارب واسعة على العديد من قواعد بيانات الصور في البيئة الحقيقية، مما أثبت صلابة الطريقة المقترحة تحت الزوايا الشديدة والتعبيرات المبالغ فيها والتشويش الشديد. وأخيرًا، نوضح أن التوافق الدقيق لوجه ثلاثي الأبعاد يمكن أن يساعد في التعرف على الوجه المستقل للزاوية، حيث حققنا دقة غير مسبوقة على قاعدة بيانات CFP-FP.