تقدير زاوية الرأس العميق باستخدام الصور الاصطناعية والتكيف المجالية المضادة الجزئية لمساحات التسمية المستمرة

يهدف تقدير اتجاه الرأس إلى توقع وضعية دقيقة من صورة واحدة. تعتمد الطرق الحالية على التعلم العميق المراقب، الذي يتطلب عادةً كميات كبيرة من البيانات المُعلَّمة. وتكون التسميات اليدوية أو القائمة على المستشعرات لاتجاهات الرأس عرضة للأخطاء. وتشكل إحدى الحلول إنشاء بيانات تدريب اصطناعية من خلال عرض نماذج الوجه ثلاثية الأبعاد. لكن الفروقات (الفاصل بين المجالات) بين الصور المُولَّدة (المجال المصدري) والصور الواقعية (المجال الهدف) قد تؤدي إلى أداء منخفض. وسمح التقدم في مجال التكيّف البصري بين المجالات بتقليل تأثير هذه الفروقات باستخدام الشبكات العصبية المُعاكسة، التي تُطابق فضاءات الميزات بين المجالات من خلال فرض ميزات غير تعتمد على المجال. وعلى الرغم من أن الدراسات السابقة في مجال التكيّف البصري بين المجالات تفترض عادةً فضاءات تسميات منفصلة ومشتركة، فإن هذه الافتراضات لا تنطبق على مهام تقدير اتجاه الرأس. نحن أول من يقدّم تكيّفًا بين المجالات لتقدير اتجاه الرأس مع التركيز على فضاءات تسميات جزئية مشتركة ومستمرة. وبشكل دقيق، نُطبّق تكييفًا للأساليب المُعتمدة على الترجيح على فضاءات تسميات مستمرة من خلال تطبيق إعادة عينة موزونة للمجال المصدري أثناء التدريب. ولتقييم منهجنا، قمنا بتحديث وتوسيع المجموعات الموجودة سابقًا، مما أدى إلى إنشاء معيار جديد لتقييم التكيّف البصري بين المجالات. تُظهر تجاربنا أن منهجنا يُحسّن دقة تقدير اتجاه الرأس في الصور الواقعية، رغم استخدامه فقط لتسميات من صور اصطناعية.