سلسلة من الشبكات العصبية التلافيفية Encoder-Decoder مع مُعدّل إحداثيات مُتعلّم للكشف المتماسك عن نقاط الوجه
أصبحت الشبكات العصبية التلافيفية (CNNs) التكنولوجيا المرجعية لعدد كبير من مشكلات الرؤية الحاسوبية. وعلى الرغم من أن الشبكات العصبية التلافيفية المستخدمة في كشف نقاط الوجه تكون قوية جدًا، إلا أنها ما زالت تعاني من نقص في الدقة عند معالجة الصور المُستخرجة في ظروف غير مُنظمة. في هذه الورقة، نستعرض استخدام سلسلة من مُعدِّلات الشبكات العصبية (Neural Net regressors) لزيادة دقة تقدير نقاط الوجه. ولتحقيق ذلك، نُضيف شبكين تشفير-إعادة تشفير (encoder-decoder CNNs) بنفس البنية المعمارية. يُنتج الشبكة الأولى مجموعة من خرائط الحرارة (heatmaps) التي توفر تقديرًا أوليًا لمواضع نقاط الوجه. أما الشبكة الثانية، التي تم تدريبها باستخدام اقتحامات مُولَّدة بشكل اصطناعي، فتُحسِّن من تحديد مواضع نقاط الوجه غير الواضحة أو المُحجبة. وأخيرًا، يتم استخدام طبقة متصلة بكثافة (densely connected layer) ذات أوزان مشتركة بين جميع خرائط الحرارة، لاسترجاع إحداثيات نقاط الوجه بدقة عالية. تحقق الطريقة المقترحة نتائج من الطراز الرائد (state-of-the-art) على مجموعات البيانات العامة الشهيرة 300W وCOFW وWFLW، والتي تُعدّ من أكثر مجموعات البيانات تحديًا على نطاق واسع.