HyperAIHyperAI

Command Palette

Search for a command to run...

Integration von Rekurrenzdynamiken für die Erkennung von Sprechemotionen

Efthymios Tzinis Georgios Paraskevopoulos Christos Baziotis Alexandros Potamianos

Zusammenfassung

Wir untersuchen die Leistungsfähigkeit von Merkmalen, die in der Sprachsignalanalyse nichtlineare Rekurrenzdynamiken erfassen können, im Kontext der Sprachemotionserkennung (SER). Die Rekonstruktion des Phasenraums jedes Sprachrahmens und die Berechnung seines jeweiligen Rekurrenzplots (RP) enthüllen komplexe Strukturen, die durch eine Rekurrenzquantifizierungsanalyse (RQA) quantifiziert werden können. Diese Maße werden über Segment- und Aussageperioden mittels statistischer Funktionale aggregiert. Wir präsentieren SER-Ergebnisse für das vorgeschlagene Merkmalsensemble auf drei Datenbanken unter Verwendung verschiedener Klassifikationsmethoden. Bei der Fusion der vorgeschlagenen Merkmale mit traditionellen Merkmalsensembles zeigen wir eine Steigerung der ungewichteten Genauigkeit um bis zu 5,7 % und 10,7 % bei den Sprecherabhängigen (SD) und Sprecherunabhängigen (SI) SER-Aufgaben im Vergleich zur Baseline. Unter Verwendung eines segmentbasierten Ansatzes demonstrieren wir den Stand der Technik auf IEMOCAP mit einem bidirektionalen rekurrenten Neuronalen Netzwerk.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp