HyperAIHyperAI

Command Palette

Search for a command to run...

vor einem Monat

EmoBench-M: Benchmarking der emotionalen Intelligenz für multimodale große Sprachmodelle

He Hu Yucheng Zhou Lianzhong You Hongbo Xu et al

EmoBench-M: Benchmarking der emotionalen Intelligenz für multimodale große Sprachmodelle

Abstract

Durch die Integration multimodaler großer Sprachmodelle (MLLMs) in robotische Systeme und verschiedene KI-Anwendungen ist die Einbettung von emotionaler Intelligenz (EI) in diese Modelle entscheidend, um Roboter in die Lage zu versetzen, menschliche emotionale Bedürfnisse effektiv zu erkennen und nahtlos in realen Szenarien zu interagieren. Bestehende statische, textbasierte oder text-bildbasierte Benchmarks übersehen die multimodalen Komplexitäten realer Interaktionen und erfassen nicht die dynamische, multimodale Natur emotionaler Ausdrücke, weshalb sie für die Bewertung der EI-Fähigkeiten von MLLMs unzureichend sind. Auf der Grundlage etablierter psychologischer Theorien zur emotionalen Intelligenz entwickeln wir EmoBench-M, ein neuartiges Benchmark-System, das zur Bewertung der EI-Fähigkeiten von MLLMs über 13 Bewertungsszenarien aus drei zentralen Dimensionen dient: grundlegende Emotionserkennung, emotionale Verständnisfähigkeit im Gespräch sowie Analyse emotionaler Situationen in sozial komplexen Kontexten. Die Bewertung sowohl offener als auch geschlossener MLLMs auf EmoBench-M offenbart eine erhebliche Leistungslücke zwischen diesen Modellen und Menschen, was die Notwendigkeit unterstreicht, ihre Fähigkeiten in Bezug auf emotionale Intelligenz weiter zu verbessern. Alle Benchmark-Ressourcen, einschließlich Code und Datensätze, sind öffentlich unter dieser URL verfügbar.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
EmoBench-M: Benchmarking der emotionalen Intelligenz für multimodale große Sprachmodelle | Forschungsarbeiten | HyperAI