Ein diskursbewusstes graphenbasiertes neuronales Netzwerk für die Emotionserkennung in Mehrparteigesprächen

Die Erkennung von Emotionen in mehrparteilichen Gesprächen (ERMC) gewinnt als aufkommendes Forschungsthema im Bereich der natürlichen Sprachverarbeitung zunehmend an Bedeutung. Vorangegangene Arbeiten konzentrieren sich auf die Exploration sequenzieller Informationen, ignorieren jedoch die diskursiven Strukturen von Gesprächen. In diesem Artikel untersuchen wir die Bedeutung diskursiver Strukturen bei der Verarbeitung informativer Kontextsignale und sprecherbezogener Merkmale für ERMC. Dazu stellen wir ein diskursbewusstes Graph-Neuronales Netzwerk (ERMC-DisGCN) für ERMC vor. Insbesondere entwerfen wir eine relationale Faltung, um die Selbst-Sprecher-Abhängigkeiten zwischen Gesprächsteilnehmern auszunutzen, um Kontextinformationen effektiv zu propagieren. Zudem nutzen wir eine gatable Faltung, um aus abhängigen Äußerungen aussagekräftigere Hinweise für ERMC auszuwählen. Die experimentellen Ergebnisse zeigen, dass unsere Methode mehrere Baselines übertrifft und somit die große Relevanz diskursiver Strukturen für ERMC belegt.