حول التمثيل والمنهجية لتقدير وضع الرأس على المدى الواسع والقصير

تقدير وضع الرأس (HPE) هو مشكلة تثير الاهتمام في رؤية الحاسوب بهدف تحسين أداء مهام معالجة الوجه في الإعدادات شبه الأمامية أو الجانبية. تتطلب التطبيقات الحديثة تحليل الوجوه في نطاق دوار كامل يبلغ 360 درجة. لا يمكن تطبيق الأساليب التقليدية لحل الحالات شبه الأمامية والجانبية بشكل مباشر على الحالة الدوارة الكاملة. في هذا البحث، نقوم بتحليل المنهجية لتقدير وضع الرأس على نطاق قصير وواسع، ونناقش أي التمثيلات والمقاييس تكون مناسبة لكل حالة. نوضح أن تمثيل الزوايا الأويلرية هو خيار جيد لتقدير وضع الرأس على نطاق قصير، ولكنه غير مناسب للدورات القصوى. ومع ذلك، فإن مشكلة القفل المحوري (gimbal lock) للزوايا الأويلرية تحول دون استخدامها كمقاييس صالحة في أي إعداد. كما نعيد النظر في المنهجية الحالية لتقييم البيانات عبر المجموعات ونلاحظ أن عدم التوافق بين أنظمة المرجع للبيانات التدريبية والاختبارية يتحيز سلباً بنتائج جميع المقالات في الأدب العلمي. نقدم إجراءً لقياس هذا الانحراف وعدم التوافق، ومنهجية جديدة لتقييم وضع الرأس عبر المجموعات التي تحدد حالات أفضل وأكثر دقة للمعيار 300W-LP|Biwi. بالإضافة إلى ذلك، نقترح توسيعاً للمقاييس الزاوية الجغرافية الذي يتيح بناء دالة خسارة تتحكم في مساهمة كل عينة تدريبية في تعظيم النموذج. أخيراً، نقدم معياراً جديداً لتقدير وضع الرأس على نطاق واسع يستند إلى مجموعة بيانات CMU Panoptic.