HyperAIHyperAI

Command Palette

Search for a command to run...

منذ شهر واحد

EmoBench-M: تقييم الذكاء العاطفي للنماذج اللغوية الكبيرة متعددة الوسائط

He Hu Yucheng Zhou Lianzhong You Hongbo Xu et al

EmoBench-M: تقييم الذكاء العاطفي للنماذج اللغوية الكبيرة متعددة الوسائط

الملخص

مع دمج نماذج اللغة الكبيرة متعددة الوسائط (MLLMs) في الأنظمة الروبوتية والتطبيقات الذكية الاصطناعية المختلفة، أصبح من الضروري دمج قدرات الذكاء العاطفي (EI) في هذه النماذج لتمكين الروبوتات من التصدي الفعّال لاحتياجات الإنسان العاطفية والتفاعل بسلاسة في السياقات الواقعية. وتتجاهل المعايير الثابتة القائمة على النص أو النص-الصورة الحالية التعقيدات متعددة الوسائط للتفاعلات الواقعية، ولا تُجسّد الطبيعة الديناميكية والمتعددة الوسائط للتعبيرات العاطفية، ما يجعلها غير كافية لتقييم قدرات الذكاء العاطفي في نماذج MLLMs. بالاعتماد على النظريات النفسية المُقرّرة للذكاء العاطفي، قمنا بتطوير EmoBench-M، وهو معيار جديد مصمم لتقييم قدرات الذكاء العاطفي في نماذج MLLMs عبر 13 سيناريوًا تقييميًا تُغطي ثلاث أبعاد رئيسية: التعرف الأساسي على المشاعر، وفهم المشاعر في السياقات الحوارية، وتحليل المشاعر في السياقات الاجتماعية المعقدة. أظهرت عمليات التقييم لنموذجين مفتوحي المصدر وآخر مغلق المصدر على EmoBench-M فجوة أداء كبيرة بينهما وبين البشر، مما يبرز الحاجة إلى تطوير قدرات الذكاء العاطفي في هذه النماذج بشكل أكبر. وجميع موارد المعيار، بما في ذلك الشفرة البرمجية والبيانات، متاحة للجمهور عبر الرابط التالي: https://...

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
EmoBench-M: تقييم الذكاء العاطفي للنماذج اللغوية الكبيرة متعددة الوسائط | الأوراق البحثية | HyperAI