HyperAIHyperAI

Command Palette

Search for a command to run...

ResEmoteNet: جسر بين الدقة وتخفيض الخسارة في التعرف على العواطف الوجهية

Arnab Kumar Roy Hemant Kumar Kathania Adhitiya Sharma Abhishek Dey Md. Sarfaraj Alam Ansari

الملخص

الوجه البشري هو مُرسل صامت للعواطف والأفكار من خلال تعبيراته الوجهية. بفضل التقدم الذي أحرزته رؤية الكمبيوتر في السنوات الأخيرة، حققت تقنية التعرف على العواطف الوجهية خطوات كبيرة، مما مكّن الآلات من فك شفرة تعقيدات الإشارات الوجهية. في هذا البحث، نقترح ResEmoteNet، وهي هندسة تعلم عميقة جديدة للتعرف على العواطف الوجهية تم تصميمها بدمج الشبكات التلافيفية (Convolutional)، والشبكات الضاغطة-المثيرة (Squeeze-Excitation (SE))، والشبكات المتبقية (Residual Networks). يركز إدخال كتلة SE بشكل انتقائي على الخصائص المهمة للوجه البشري، ويحسن تمثيل الخصائص ويقلل من الأقل أهمية منها. هذا يساعد في تقليل الخسارة وتحسين أداء النموذج العام. كما قمنا بدمج كتلة SE مع ثلاث كتل متبقية تساعدها في تعلم تمثيل أكثر تعقيدًا للبيانات عبر طبقات أعمق. قمنا بتقييم ResEmoteNet على أربع قواعد بيانات مفتوحة المصدر هي: FER2013، RAF-DB، AffectNet-7 و ExpW، حيث حققت دقة بنسبة 79.79٪، 94.76٪، 72.39٪ و 75.67٪ على التوالي. يتفوق الشبكة المقترحة على أفضل النماذج الحالية في جميع القواعد البيانات الأربعة. يمكن الوصول إلى الكود المصدر لـ ResEmoteNet عبر الرابط:https://github.com/ArnabKumarRoy02/ResEmoteNet.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp