HyperFace: إطار تعلم متعدد المهام عميق للكشف عن الوجه، وتحديد المعالم، وتقدير الوضعية، وتمييز الجنس

نقدم خوارزمية للكشف عن الوجوه وتحديد المعالم وتقدير الوضعية وتمييز الجنس باستخدام شبكات العصبونات التلافيفية العميقة (CNN). الطريقة المقترحة، التي تُعرف باسم HyperFace، تقوم بدمج طبقات الشبكة العصبية التلافيفية العميقة الوسيطة باستخدام شبكة عصبية تلافيفية منفصلة، يتبعها خوارزمية تعلم متعدد المهام تعمل على الميزات المدمجة. هذه الطريقة تستفيد من التناغم بين المهام، مما يعزز أداء كل منها بشكل فردي. بالإضافة إلى ذلك، نقترح نوعين من HyperFace: (1) HyperFace-ResNet التي تعتمد على نموذج ResNet-101 وتحقق تحسينًا كبيرًا في الأداء، و(2) Fast-HyperFace التي تستخدم كاشف وجوه سريع ذو استدعاء عالٍ لإنشاء مقترحات المناطق بهدف تحسين سرعة الخوارزمية. التجارب الواسعة تظهر أن النماذج المقترحة قادرة على التقاط المعلومات العالمية والمحلية في الوجوه وأدائها أفضل بكثير من العديد من الخوارزميات المنافسة لكل من هذه المهام الأربعة.