HyperAIHyperAI
vor 2 Monaten

Integration von Rekurrenzdynamiken für die Erkennung von Sprechemotionen

Efthymios Tzinis; Georgios Paraskevopoulos; Christos Baziotis; Alexandros Potamianos
Integration von Rekurrenzdynamiken für die Erkennung von Sprechemotionen
Abstract

Wir untersuchen die Leistungsfähigkeit von Merkmalen, die in der Sprachsignalanalyse nichtlineare Rekurrenzdynamiken erfassen können, im Kontext der Sprachemotionserkennung (SER). Die Rekonstruktion des Phasenraums jedes Sprachrahmens und die Berechnung seines jeweiligen Rekurrenzplots (RP) enthüllen komplexe Strukturen, die durch eine Rekurrenzquantifizierungsanalyse (RQA) quantifiziert werden können. Diese Maße werden über Segment- und Aussageperioden mittels statistischer Funktionale aggregiert. Wir präsentieren SER-Ergebnisse für das vorgeschlagene Merkmalsensemble auf drei Datenbanken unter Verwendung verschiedener Klassifikationsmethoden. Bei der Fusion der vorgeschlagenen Merkmale mit traditionellen Merkmalsensembles zeigen wir eine Steigerung der ungewichteten Genauigkeit um bis zu 5,7 % und 10,7 % bei den Sprecherabhängigen (SD) und Sprecherunabhängigen (SI) SER-Aufgaben im Vergleich zur Baseline. Unter Verwendung eines segmentbasierten Ansatzes demonstrieren wir den Stand der Technik auf IEMOCAP mit einem bidirektionalen rekurrenten Neuronalen Netzwerk.

Integration von Rekurrenzdynamiken für die Erkennung von Sprechemotionen | Neueste Forschungsarbeiten | HyperAI