HyperAIHyperAI
منذ 18 أيام

شبكات الانحدار الشكلي المباشر لل.Alignments الوجه النهائية النهائية

{Xian-Tong Zhen, Xianglong Liu, Heng Huang, Xin Miao, Vassilis Athitsos, Cheng Deng}
شبكات الانحدار الشكلي المباشر لل.Alignments الوجه النهائية النهائية
الملخص

تم دراسة التحديد الوجهي بشكل واسع في مجتمع رؤية الحاسوب نظرًا لأدواره الأساسية في تحليل الوجه، لكنه ما زال يمثل مشكلة غير محلولة. تكمن التحديات الرئيسية في العلاقة غير الخطية العالية بين صور الوجه والأشكال الوجهية المرتبطة بها، والتي تترابط بشكل متأصل عبر ترابطات النقاط المرجعية (landmarks). تعتمد الطرق الحالية بشكل رئيسي على الانحدار المتسلسل (cascaded regression)، وتعاني من عيوب داخلية، مثل الاعتماد الشديد على البداية الأولية وعدم القدرة على استغلال الترابطات بين النقاط المرجعية. في هذا البحث، نقترح شبكة الانحدار المباشر للشكل (DSRN) للتحديد الوجهي من النهاية إلى النهاية، من خلال معالجة التحديات المذكورة أعلاه بشكل موحد ضمن إطار متكامل. وبشكل خاص، من خلال استخدام طبقة ت.Convolutionية مزدوجة (doubly convolutional layer) واستخدام طبقة تجميع الميزات التوافقية (Fourier feature pooling layer) التي نقترحها في هذا العمل، تُنشئ DSRN تمثيلات قوية بكفاءة لفصل العلاقات غير الخطية العالية بين الصور والأشكال؛ وباستخدام طبقة خطية تعتمد على تعلم ذات رتبة منخفضة (low-rank learning)، تُشغّل DSRN بشكل فعّال ترميز الترابطات بين النقاط المرجعية لتحسين الأداء. تُستفيد DSRN من مزايا النوى (kernels) في استخلاص الميزات غير الخطية، ومن قدرات الشبكات العصبية على التنبؤ الهيكلي، وتقدّم أول بنية تعلّم من النهاية إلى النهاية للتحديد الوجهي المباشر. وقد تم التحقق من فعالية DSRN وعموميتها من خلال تجارب واسعة على خمسة مجموعات بيانات معيارية، تشمل AFLW و300W وCelebA وMAFL و300VW. وجميع النتائج التجريبية تُظهر أن DSRN تُنتج أداءً عاليًا باستمرار، وتتفوق في معظم الحالات على أفضل الطرق الحالية (state-of-the-art).