vor 6 Monaten

Zusammenfassung

Die Erkennung von Emotionen in Gesprächen (Emotion Recognition in Conversation, ERC) spielt eine bedeutende Rolle in Systemen der Mensch-Computer-Interaktion (Human-Computer Interaction, HCI), da sie empathische Dienstleistungen ermöglicht. Multimodale ERC kann die Nachteile einmodaler Ansätze überwinden. In jüngster Zeit werden Graph Neural Networks (GNNs) aufgrund ihrer herausragenden Leistung bei der Modellierung von Beziehungen in einer Vielzahl von Anwendungsgebieten zunehmend eingesetzt. In der multimodalen ERC sind GNNs in der Lage, sowohl kontextuelle Informationen über weite Distanzen als auch intermodale Interaktionsinformationen zu extrahieren. Leider führen bestehende Methoden wie MMGCN, die mehrere Modi direkt fusionieren, oft zu redundanter Information und verlieren dabei vielfältige, wichtige Informationen. In dieser Arbeit präsentieren wir ein gerichtetes Graph-basiertes Modul zur cross-modalen Merkmalsergänzung (GraphCFC), das kontextuelle und interaktive Informationen effizient modellieren kann. GraphCFC verringert das Problem der Heterogenitätslücke bei der multimodalen Fusion durch den Einsatz mehrerer Unterraum-Extraktoren und einer Paarweisen Cross-modalen Ergänzungsstrategie (PairCC). Wir extrahieren verschiedene Arten von Kanten aus dem aufgebauten Graphen zur Kodierung, wodurch GNNs bei der Nachrichtenweitergabe präziser entscheidende kontextuelle und interaktive Informationen erfassen können. Darüber hinaus entwerfen wir eine GNN-Architektur namens GAT-MLP, die einen neuen einheitlichen Netzwerkrahmen für multimodales Lernen bereitstellt. Die experimentellen Ergebnisse auf zwei Standard-Datensätzen zeigen, dass unser GraphCFC die derzeit besten Ansätze (SOTA) übertrifft.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Emotionserkennung

Multimodale Darstellung

Multimodal

Sonstige

Aufgabe

Jiang Li Xiaoping Wang Guoqing Lv Zhigang Zeng

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Emotionserkennung

Multimodale Darstellung

Multimodal

Sonstige

Aufgabe

Jiang Li Xiaoping Wang Guoqing Lv Zhigang Zeng

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

GraphCFC: Ein auf gerichteten Graphen basierender Ansatz zur multimodalen Merkmalsergänzung für die emotionale Erkennung in multimodalen Gesprächen | Paper | HyperAI

Command Palette

GraphCFC: Ein auf gerichteten Graphen basierender Ansatz zur multimodalen Merkmalsergänzung für die emotionale Erkennung in multimodalen Gesprächen

Jiang Li Xiaoping Wang Guoqing Lv Zhigang Zeng

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

GraphCFC: Ein auf gerichteten Graphen basierender Ansatz zur multimodalen Merkmalsergänzung für die emotionale Erkennung in multimodalen Gesprächen

Jiang Li Xiaoping Wang Guoqing Lv Zhigang Zeng

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

GraphCFC: Ein auf gerichteten Graphen basierender Ansatz zur multimodalen Merkmalsergänzung für die emotionale Erkennung in multimodalen Gesprächen

Jiang Li Xiaoping Wang Guoqing Lv Zhigang Zeng

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters