الأنف، العيون والأذنين: تقدير وضع الرأس من خلال تحديد نقاط الميزات الوجهية

تقدير وضع الرأس الأحادي يتطلب تعلم نموذج يحسب الزوايا الأويلرية الداخلية لوضع الرأس (الدوران حول المحور الرأسي، الدوران حول المحور الجانبي، الدوران حول المحور الأفقي) من صورة مدخل للوجه البشري. تحديد زوايا وضع الرأس الحقيقية للصور في البيئة الطبيعية أمر صعب ويحتاج إلى إجراءات تناسب عرضية (والتي توفر فقط تحديدًا خشنًا تقريبيًا). هذا يؤكد الحاجة إلى نهج يمكنها التدريب على البيانات الملتقطة في بيئة مراقبة والتوسع في الصور في البيئة الطبيعية (مع اختلافات في مظهر الإضاءة للوجه). معظم النماذج العميقة الحالية التي تتعلم دالة الانحدار مباشرة على الصور المدخل تفشل في القيام بذلك. بناءً على ذلك، نقترح استخدام تمثيل أعلى مستوى لتقدير وضع الرأس مع الاستفادة من هندسة التعلم العميق. بشكل أكثر تحديدًا، نستخدم خرائط عدم اليقين على شكل صور خرائط حرارية مرنة ثنائية الأبعاد فوق خمس نقاط رئيسية في الوجه، وهي: الأذن اليسرى، والأذن اليمنى، والعين اليسرى، والعين اليمنى، والأنف، ونقلها عبر شبكة عصبية اصطناعية مت convoled لتقدير وضع الرأس. نعرض نتائج تقدير وضع الرأس على مقعدين تحديين هما BIWI وAFLW ، حيث يتفوق نهجنا على أحدث التقنيات المستخدمة في كلتا القاعدتين.注释:在阿拉伯语中,“convoled”一词并不常见,因此这里保留了英文原词。同时,“BIWI”和“AFLW”作为数据集名称也直接保留了英文原名。