HyperAIHyperAI

Command Palette

Search for a command to run...

كشف وتنبؤ بالمشاعر في الفيديو باستخدام إشراف ضعيف من خلال شبكة إزالة زمنية عبر الوسائط

Jufeng Yang Lijuan Wang Zhicheng Zhang

الملخص

يحظى التنبؤ التلقائي بالمشاعر في مقاطع الفيديو التي ينشئها المستخدمون (UGVs) باهتمام متزايد في الآونة الأخيرة. ومع ذلك، تركز الطرق الحالية بشكل رئيسي على عدد محدود من الإطارات البصرية الأساسية، مما قد يحد من قدرتها على تمثيل السياق الذي يعكس المشاعر المقصودة. ولحل هذه المشكلة، نقترح في هذه الورقة شبكة زمنية متعددة الوسائط تقوم بحذف الزمنية عبر الوسائط، والتي تُحدد ليس فقط الإطارات الأساسية، بل أيضًا المعلومات السياقية والمرتبطة بالصوت بطريقة غير مُراقبة بشكل ضعيف. وبشكل محدد، نستخدم أولًا العلاقات الداخلية والخارجية بين الأجزاء المختلفة لاختيار الإطارات الأساسية بدقة. ثم نُكرر عملية حذف الإطارات الأساسية لتشجيع النموذج على التركيز على السياقات التي تحتوي على معلومات مكملة. وأظهرت التجارب الواسعة على ثلاث معايير صعبة لتحليل مشاعر الفيديو أن أداء طريقة الاقتراح يتفوق على الطرق الرائدة في مجالها. وتم إتاحة الشفرة المصدرية على الرابط: https://github.com/nku-zhichengzhang/WECL.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp