11日前
LSSED:発話感情認識のための大規模データセットおよびベンチマーク
Weiquan Fan, Xiangmin Xu, Xiaofen Xing, Weidong Chen, Dongyan Huang

要約
発話感情認識は、次世代の人間-コンピュータインタラクション(HCI)を支える重要な要素である。しかし、現行の小規模なデータベースは、関連研究の発展を制限している。本論文では、実世界の感情分布を模倣するため、820名の被験者から収集したデータを含む、挑戦的な大規模英語発話感情データセット「LSSED」を提案する。さらに、LSSEDに基づく事前学習モデルを公開しており、これらは発話感情認識の発展を促進するだけでなく、データ収集が極めて困難な精神健康分析などの関連する下流タスクへの転移も可能である。最後に、実験結果から大規模データセットの必要性および事前学習モデルの有効性が示された。本データセットは、https://github.com/tobefans/LSSED にて公開される予定である。