تقدير وضع الرأس بدقة عالية بدون نقاط مفتاحية

تقدير وضعية الرأس للشخص هو مشكلة حاسمة لها تطبيقات عديدة مثل المساعدة في تقدير النظر، ونمذجة الانتباه، وتناسب النماذج ثلاثية الأبعاد مع الفيديو، وإجراء محاذاة الوجه. بشكل تقليدي، يتم حساب وضعية الرأس من خلال تقدير بعض النقاط الرئيسية من الوجه المستهدف وحل مشكلة التوافق بين البعد الثاني والثالث باستخدام نموذج رأس بشري متوسط. نعتقد أن هذا هو طريقة هشة لأنه يعتمد بالكامل على أداء اكتشاف المعالم، والنماذج الخارجية للرأس، وخطوة تناسب عشوائية. نقدم طريقة أنيقة وقوية لتحديد الوضعية من خلال تدريب شبكة عصبية متعددة الخسائر على مجموعة بيانات 300W-LP، وهي مجموعة بيانات كبيرة تم توسيعها بشكل صناعي، لتوقع الزوايا الأويلرية الذاتية (الدوران حول المحور الرأسي، الدوران حول المحور الجانبي، الدوران حول المحور الأمامي) مباشرة من كثافة الصورة عبر تصنيف وضعيات مشتركة ومربعات الانحدار. نقدم اختبارات تجريبية على مجموعات البيانات الشائعة التي تستخدم لقياس الوضعية في البيئات الطبيعية والتي تظهر نتائجًا في مستوى الحالة الفنية المتقدمة. بالإضافة إلى ذلك، قمنا باختبار طريقتنا على مجموعة بيانات تُستخدم عادةً لتقدير الوضعية باستخدام العمق وأصبحنا قريبين جدًا من إغلاق الفجوة مع أفضل الأساليب الحالية لتقدير الوضعية باستخدام العمق. لقد أصدرنا شفرتنا المصدر للتدريب والاختبار وأطلقنا أيضًا نماذجنا المدربة مسبقًا.