音声感情認識
音声における感情認識は、音声処理や計算機パラリンギスティクスのタスクの一つで、話者の表現する感情状態(喜び、怒り、悲しみ、または挫折感など)を、イントネーション、ピッチ、リズムなどの音声パターンを分析することで識別し、分類することを目指しています。この技術は、人間とコンピュータの対話、精神健康の評価、カスタマーサービスなどの分野で重要な応用価値を持っています。マルチモーダルな感情認識については、指定されたページに結果をアップロードしてください。
CREMA-D
SepTr
IEMOCAP
SER with MTL
RAVDESS
xlsr-Wav2Vec2.0(FineTuning)
MSP-Podcast (Valence)
MSP-Podcast (Activation)
wav2small-Teacher
MSP-Podcast (Dominance)
w2v2-L-robust-12
RESD
emotion2vec+base
Dusha Crowd
Dusha Podcast
Dusha baseline
EMODB
VGG-optiVMD
EmoDB Dataset
VQ-MAE-S-12 (Frame) + Query2Emo
LSSED
PyResNet
MSP-IMPROV
emoDARTS
Quechua-SER
LSTM
ShEMO