HyperAIHyperAI

Command Palette

Search for a command to run...

استخدام خصائص المشهد الدلالية والهياكل الشبكية متعددة التدفقات في نهج سياقي للاعتراف بالعواطف البصرية القائمة على الفيديو في البيئة الحقيقية

Ioannis Pikoulis Panagiotis P. Filntisis Petros Maragos

الملخص

في هذا العمل، نواجه مهمة التعرف على العواطف البصرية القائمة على الفيديو في البيئات الطبيعية. تُعاني الأساليب القياسية التي تعتمد فقط على استخراج الخصائص الجسدية والوجهية من عدم الدقة في التنبؤ بالعواطف في الحالات التي تكون فيها مصادر المعلومات العاطفية المذكورة غير متاحة بسبب اتجاه الرأس أو الجسم، الدقة المنخفضة والإضاءة السيئة. نسعى إلى تخفيف هذه المشكلة من خلال الاستفادة من السياق البصري على شكل خصائص وسمات المشهد، كجزء من إطار عمل أوسع للتعرف على العواطف. تشكل شبكات المقاطع الزمنية (TSN) العمود الفقري للنموذج المقترح لدينا. بالإضافة إلى وضعية المدخلات RGB، نستخدم التدفق البصري الكثيف، مع اتباع نهج متعدد الأغشية بديهي لتحقيق ترميز حركة أكثر فعالية. علاوة على ذلك، نركز اهتمامنا على التعلم القائم على الهيكل العظمي واستخدام البيانات المركزية حول الحركة كوسيلة لتدريب شبكة التجاور الزماني-المكاني (ST-GCN) للمهمة الخاصة بالتعرف على العواطف. تؤكد تجاربنا الواسعة على مجموعة بيانات لغة الجسم الصعبة (BoLD) تفوق طرقنا على النهج الموجودة حالياً، بينما من خلال دمج جميع الوحدات المذكورة بشكل صحيح في مجموعة الشبكات، نتمكن من تجاوز أفضل درجات التعرف المنشورة سابقاً بمقدار كبير.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp