نموذج ثلاثي الأبعاد قوي ومميز باستخدام شبكة عصبية عميقة للغاية

أشكال الوجوه ثلاثية الأبعاد معروفة بأنها تمييزية. ومع ذلك، فإنها نادراً ما تُستخدم في التعرف على الوجه، وعند استخدامها تكون دائمًا تحت ظروف مشاهدة مُحكمة. نعتقد أن هذا يُعد علامة على مشكلة جدية ولكن غالباً ما يتم تجاهلها في الأساليب الحالية لإعادة بناء الوجه ثلاثي الأبعاد من صورة واحدة: عند تطبيق هذه الأساليب "في البرية"، تقديراتها ثلاثية الأبعاد إما غير مستقرة وتتغير لصور مختلفة لنفس الشخص أو تكون مفرطة التنظيم وتكون عامة. كرد على ذلك، نصف طريقة قوية لإرجاع النماذج القابلة للتغيير للوجه ثلاثي الأبعاد (3DMM). نستخدم شبكة عصبية ارتباطية (CNN) لإرجاع معلمات الشكل والملمس لنموذج 3DMM مباشرة من صورة المدخل. نتجاوز قلة البيانات التدريبية اللازمة لهذا الغرض بتقديم طريقة لتوليد أعداد ضخمة من الأمثلة المُصنفة. تقديرات 3D التي تنتجها شبكتنا العصبية ارتباطية تتفوق على دقة أفضل التقنيات الحالية في مجموعة بيانات MICC. بالاشتراك مع خط أنابيب مطابقة الوجه 3D-3D، نظهر أول نتائج تنافسية للتعرف على الوجه في مقاييس LFW وYTF وIJB-A باستخدام أشكال الوجوه ثلاثية الأبعاد كتمثيلات، بدلاً من المتجهات المميزة العميقة المستخدمة من قبل أنظمة حديثة أخرى.