Command Palette
Search for a command to run...
الاندماج بين الانحدار التبادلي والانحدار الإحداثي لتحديد دقيق لنقاط الملامح الوجهية ثلاثية الأبعاد
الاندماج بين الانحدار التبادلي والانحدار الإحداثي لتحديد دقيق لنقاط الملامح الوجهية ثلاثية الأبعاد
Zhang Hongwen Li Qi Sun Zhenan
الملخص
تتميز الشكل الوجهي ثلاثي الأبعاد بالتعبيرية الأقوى والاتساق الأفضل من حيث الزاوية المراقبة مقارنةً بنسخته ثنائية الأبعاد. ومع ذلك، يُعدّ تحديد نقاط الملامح الوجهية ثلاثية الأبعاد في صورة واحدة تحديًا كبيرًا نظرًا للطبيعة الغامضة لتقاطعات الملامح تحت الرؤية ثلاثية الأبعاد. تُعتمد في الطرق الحالية عادةً استراتيجية ثنائية الخطوات غير المثلى، حيث يتم أولاً تحديد الملامح ثنائية الأبعاد، ثم تقدير العمق. في هذه الدراسة، نقترح طريقةً جديدة تُسمى "الانحدار المشترك للبُكَر والإحداثيات" (JVCR) لتحديد الملامح الوجهية ثلاثية الأبعاد، وبشكل أكثر فعالية من خلال نهج متكامل (end-to-end). أولاً، نُقدّم تمثيلًا حجميًا مكثفًا يُعبّر عن احتمالية وقوع كل بُكْرة (Voxel) في الموقع ثلاثي الأبعاد المقابل لملامح الوجه. ويظل بعد ذلك بعد تمثيل هذا البُكْرة ثابتًا بغض النظر عن عدد الملامح المستهدفة، مما يُقلل من مشكلة "مُعضلة الأبعاد" (Curse of Dimensionality). ثانياً، نستخدم شبكة "ساعة رملية متعددة الطبقات" (stacked hourglass network) لتقدير التمثيل الحجمي من المستوى الخشن إلى الدقيق، يليها شبكة ت.Convolution ثلاثية الأبعاد التي تأخذ هذا التمثيل المقدّر كمدخل، وتُقدّر إحداثيات الوجه ثلاثية الأبعاد. وبهذا، يمكن للشبكة العصبية تعلّم القيود الهيكلية ثلاثية الأبعاد بين الملامح بطريقة أكثر كفاءة. علاوةً على ذلك، يمكّن هذا النموذج المُقترح التدريب المتكامل (end-to-end)، ويعزز من دقة وثبات عملية تحديد الملامح الوجهية ثلاثية الأبعاد. وقد تم التحقق من فعالية النهج المُقترح على مجموعتي بيانات 3DFAW وAFLW2000-3D، وأظهرت النتائج التجريبية أن الطريقة المقترحة تحقق أداءً متفوقًا على الطرق السابقة.