HyperAIHyperAI
منذ 16 أيام

FSA-Net: تعلّم تجميع البنية الدقيقة لتقدير اتجاه الرأس من صورة واحدة

{ Yung-Yu Chuang, Yen-Yu Lin, Yi-Ting Chen, Tsun-Yi Yang}
FSA-Net: تعلّم تجميع البنية الدقيقة لتقدير اتجاه الرأس من صورة واحدة
الملخص

يُقدّم هذا البحث منهجية لتقدير اتجاه الرأس من صورة واحدة. غالبًا ما تُقدّر الطرق السابقة اتجاه الرأس من خلال تقدير نقاط المفتاح أو الخلفية العميقة، مما يتطلب حسابات أكثر من اللازم. تعتمد طريقة البحث الحالية على الانحدار وجمع الميزات. ولضمان نموذج مدمج، نستخدم خطة الانحدار الناعم المتسلسل. تُعامل الطرق الحالية لجمع الميزات المدخلات كمجموعة من الميزات، وبالتالي تتجاهل العلاقات المكانية بينها في خريطة الميزات. ونُقدّم طريقة لتعلم خريطة هيكلية دقيقة لتنظيم الميزات مكانيًا قبل جمعها. توفر هذه الهيكلية الدقيقة معلومات مبنية على الأجزاء، بالإضافة إلى القيم المُجمعة. وباستخدام أهمية قابلة للتعلم وغير قابلة للتعلم حسب الموقع المكاني، يمكن إنشاء أشكال مختلفة من النموذج، والتي تُشكّل تجميعًا مكملًا. تُظهر التجارب أن طريقة البحث تتفوّق على أفضل الطرق الحالية، سواءً تلك التي لا تعتمد على نقاط المفتاح أو التي تعتمد على نقاط المفتاح أو الخلفية العميقة. وباستخدام إطار RGB واحد فقط كمدخل، تتفوّق طريقة البحث حتى على الطرق التي تستخدم معلومات متعددة الوسائط (RGB-D، RGB-Time) في تقدير زاوية الـ yaw. علاوةً على ذلك، يقلّ حجم استهلاك الذاكرة في نموذجنا بنسبة 100 مرة مقارنةً بالطرق السابقة.

FSA-Net: تعلّم تجميع البنية الدقيقة لتقدير اتجاه الرأس من صورة واحدة | أحدث الأوراق البحثية | HyperAI