HyperAIHyperAI

Command Palette

Search for a command to run...

LSSED : un jeu de données à grande échelle et une référence pour la reconnaissance émotionnelle de la parole

Weiquan Fan Xiangmin Xu Xiaofen Xing Weidong Chen Dongyan Huang

Résumé

La reconnaissance émotionnelle à partir de la parole constitue une contribution essentielle à la prochaine génération d’interactions homme-machine (IHM). Toutefois, les bases de données actuelles à petite échelle limitent le développement de recherches dans ce domaine. Dans cet article, nous présentons LSSED, un ensemble de données massives et exigeant sur la reconnaissance émotionnelle à partir de la parole en anglais, constitué de données collectées auprès de 820 sujets afin de simuler une répartition réelle du monde réel. Par ailleurs, nous mettons à disposition plusieurs modèles pré-entraînés basés sur LSSED, qui non seulement favorisent le progrès de la reconnaissance émotionnelle à partir de la parole, mais peuvent également être transférés à des tâches ultérieures connexes, telles que l’analyse de la santé mentale, où la collecte de données est particulièrement difficile. Enfin, nos expérimentations démontrent l’importance des jeux de données à grande échelle ainsi que l’efficacité des modèles pré-entraînés. L’ensemble de données sera mis à disposition sur https://github.com/tobefans/LSSED.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp