HyperAIHyperAI
منذ 15 أيام

تقدير اتجاه الرأس متعدد المهام في البيئة الطبيعية

Roberto Valle, José Miguel Buenaposada, Luis Baumela
تقدير اتجاه الرأس متعدد المهام في البيئة الطبيعية
الملخص

نقدّم نهجًا مبنيًا على التعلم العميق متعدد المهام لتقدير اتجاه الرأس في الصور. نُسهم من خلال معمارية شبكة واستراتيجية تدريب تُستغل الاعتماد القوي بين اتجاه الوجه، والمحاذاة، ودرجة الرؤية، لإنتاج نموذج يُظهر أداءً متميزًا في جميع المهام الثلاثة. تتكوّن معماريّتنا من شبكة عصبية تلافيفية (CNN) مُكوّنة من وحدات تشفير وفك تشفير، مع كتل متكررة (residual blocks) واتصالات جانبية (lateral skip connections). نُظهر أن الجمع بين تقدير اتجاه الرأس والمحاذاة القائمة على الملامح الوجهية يُحسّن بشكل كبير أداء المهمة الأولى. علاوةً على ذلك، فإن وضع مهمة تقدير الاتجاه في طبقة التضييق (bottleneck layer) في نهاية مرحلة التشفير، ووضع المهام التي تعتمد على المعلومات المكانية مثل الرؤية والمحاذاة في الطبقة النهائية لمرحلة فك التشفير، يسهمان أيضًا في تعزيز الأداء النهائي. في التجارب التي أُجريت، تفوق النموذج المقترح على أحدث النماذج في مهام تقدير اتجاه الوجه وتحديد الرؤية. وبإضافة خطوة نهائية لانحدار الملامح، يُنتج النموذج أيضًا نتائج محاذاة للوجه مُقارنةً بأفضل النماذج الحالية.

تقدير اتجاه الرأس متعدد المهام في البيئة الطبيعية | أحدث الأوراق البحثية | HyperAI