نهج مبني على البيانات لتحسين تقدير اتجاه الرأس ثلاثي الأبعاد
تمثّل تقدير اتجاه الرأس من الصور موضوعًا بحثيًا مهمًا في رؤية الحاسوب. وتشمل تطبيقاته العديدة كشف انتباه المستخدم، وتتبع سلوك السائق، والتفاعل بين الإنسان والحاسوب. ركّزت الدراسات الحديثة في تقدير اتجاه الرأس على تطوير نماذج تعتمد على الشبكات العصبية التلافيفية العميقة (CNN). حيث تُدرّب هذه النماذج باستخدام تقنية التعلم الناقل (Transfer Learning) وتوسيع الصور (Image Augmentation) لتحقيق حالات بداية أفضل ومقاومة أقوى للتغطية (الإغلاق). ومع ذلك، فإن الطرق التي تعتمد على الشبكات الناقلة غالبًا ما تُركّز على التعرف العام على الصور، ولا تقدّم دراسة متعمقة لعملية التعلم الناقل من شبكات مرتبطة أكثر بالمهام المحددة. علاوةً على ذلك، فإن المقاومة القوية أمام التغطية الشديدة، والضوضاء مثل التشويش الناتج عن الحركة (Motion Blur) والسطوع المنخفض، تُعدّ أمورًا بالغة الأهمية في تقدير اتجاه الرأس. في هذا البحث، نقترح منهجية جديدة لتوسيع الصور تُحسّن بشكل ملحوظ من دقة نموذج تقدير اتجاه الرأس. كما نقترح تهيئة أوزان مُخصصة للمهمة، لتحسين دقة التقدير أكثر من خلال دراسة التنشيطات الداخلية للنماذج التي تم تدريبها على مهام مرتبطة بالوجه مثل التعرف على الوجه. وقد تم اختبار نموذجنا لتقدير اتجاه الرأس على ثلاث مجموعات اختبار صعبة، وحقق نتائج أفضل مقارنةً بالأساليب المتطورة حديثًا.