HyperAIHyperAI

Command Palette

Search for a command to run...

COGMEN: COntextualized GNN-basierte multimodale Emotionserkennung

Abhinav Joshi Ashwani Bhat Ayush Jain Atin Vikram Singh Ashutosh Modi

Zusammenfassung

Emotionen sind ein wesentlicher Bestandteil menschlicher Interaktionen, weshalb es unerlässlich ist, KI-Systeme zu entwickeln, die menschliche Emotionen verstehen und erkennen können. Während eines Gesprächs zwischen mehreren Personen werden die Emotionen einer Person durch die Äußerungen der anderen Gesprächspartner sowie durch ihren eigenen emotionalen Zustand über die einzelnen Äußerungen beeinflusst. In diesem Paper stellen wir das COntextualized Graph Neural Network based Multimodal Emotion recognitioN (COGMEN)-System vor, das sowohl lokale Informationen (d. h. inter- und intra-Abhängigkeiten zwischen Sprechern) als auch globale Informationen (Kontext) nutzt. Das vorgeschlagene Modell basiert auf einer Graph Neural Network (GNN)-Architektur, um die komplexen Abhängigkeiten (lokale und globale Informationen) in einem Gespräch effektiv zu modellieren. Unser Modell erzielt state-of-the-art (SOTA)-Ergebnisse auf den Datensätzen IEMOCAP und MOSEI, und detaillierte Ablationsstudien belegen die Bedeutung der Modellierung von Informationen auf beiden Ebenen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
COGMEN: COntextualized GNN-basierte multimodale Emotionserkennung | Paper | HyperAI