WHen: تقدير فوري دقيق النطاق لاتجاه الرأس على مدى واسع

نقدّم شبكة لتقدير اتجاه الرأس من طرف إلى طرف، مصممة لتوقع زوايا أويلر من خلال النطاق الكامل لانحرافات الرأس من صورة RGB واحدة. تُظهر الطرق الحالية أداءً جيدًا في الرؤى الأمامية، لكن قلة منها تستهدف تقدير اتجاه الرأس من جميع الزوايا. تُعد هذه التقنية ذات تطبيقات في القيادة الذاتية والتجزئة. تعتمد شبكتنا على نهج متعددة الخسائر، مع إدخال تغييرات على دوال الخسارة واستراتيجيات التدريب، بما يتناسب مع التقدير على نطاق واسع. بالإضافة إلى ذلك، قمنا باستخراج تسميات حقيقية للرؤى الأمامية لأول مرة من مجموعة بيانات بانوبيتك الحالية. النتيجة هي شبكة تقدير اتجاه الرأس الواسعة (WHENet)، وهي أول طريقة حديثة دقيقة تُطبّق على كامل نطاق انحرافات الرأس (وهذا ما يُفسّر تسميتها "واسعة")، وفي الوقت نفسه تحقق أداءً يُوازي أو يتفوق على أفضل الطرق الحالية في تقدير اتجاه الرأس الأمامي. وتتميز شبكتنا بالصغر والكفاءة، مما يجعلها مناسبة للأجهزة المحمولة والتطبيقات المختلفة.