11 天前

基于深度神经网络的波斯语情感识别

Ali Yazdani, Hossein Simchi, Yasser Shekofteh
基于深度神经网络的波斯语情感识别
摘要

语音情感识别(Speech Emotion Recognition, SER)在人机交互(Human-Computer Interaction, HCI)中具有重要意义,它能够深化对交互情境的理解,从而实现更高效、更自然的人机互动。近年来,多种机器学习与深度学习(Deep Learning, DL)算法被提出,以提升SER技术的性能。然而,语音情感的识别效果依赖于表达方式,而不同语言间的情感表达存在差异。本文针对波斯语(Farsi/Persian)这一语言特点,进一步探讨其在情感识别中的关键影响因素。研究基于2018年发布的Sharif情感语音数据库(ShEMO),系统评估了多种深度学习技术。通过结合低层与高层信号特征,以及不同的深度神经网络和机器学习方法,实验取得了未加权准确率(Unweighted Accuracy, UA)65.20%和加权准确率(Weighted Accuracy, WA)78.29%的性能表现。

基于深度神经网络的波斯语情感识别 | 最新论文 | HyperAI超神经