HyperAIHyperAI
منذ 9 أيام

L2CS-Net: تقدير التوجيه الدقيق في البيئات غير المقيدة

Ahmed A.Abdelrahman, Thorsten Hempel, Aly Khalifa, Ayoub Al-Hamadi
L2CS-Net: تقدير التوجيه الدقيق في البيئات غير المقيدة
الملخص

النظر البشري هو مؤشر مهم يستخدم في تطبيقات مختلفة مثل التفاعل بين الإنسان والروبوتات والواقع الافتراضي. في الآونة الأخيرة، حققت النماذج القائمة على الشبكات العصبية التلافيفية (CNN) تقدماً ملحوظاً في توقع اتجاه النظر. ومع ذلك، ما يزال تقييم اتجاه النظر في البيئات الطبيعية (in-the-wild) مشكلة صعبة نظراً لتمايز مظهر العين، وظروف الإضاءة المتغيرة، وتنوع وضعية الرأس واتجاهات النظر. في هذه الورقة، نقترح نموذجاً قوياً قائماً على الشبكة العصبية التلافيفية لتقدير اتجاه النظر في البيئات غير المقيدة. نقترح تقدير كل زاوية من زوايا النظر بشكل منفصل لتحسين دقة التقدير لكل زاوية، مما يعزز الأداء العام لتقدير النظر. بالإضافة إلى ذلك، نستخدم خسارة متماثلة مرتين، واحدة لكل زاوية، لتحسين تعلم الشبكة وزيادة قدرتها على التعميم. قمنا بتقييم نموذجنا باستخدام مجموعتي بيانات شهيرتين تم جمعهما في بيئات غير مقيدة. وحقق النموذج المقترح دقة متقدمة على مستوى العالم، بقيمة 3.92° و10.41° على مجموعتي بيانات MPIIGaze وGaze360 على التوالي. وسنقوم بجعل الكود مفتوح المصدر عبر الرابط: https://github.com/Ahmednull/L2CS-Net.