Command Palette
Search for a command to run...
{Carlos Busso Berrak Sisman Najim Dehak Leibny Paola Garcia Thomas Thebaud Laureano Moro Velazquez Abinay R. Naini Ali N. Salman Lucas Goncalves}
要約
Odyssey 2024 話語感情認識(SER)チャレンジは、演技された状況から得られた従来のデータセットにとどまらず、自然な会話から感情を認識する技術の革新を促進することを目的としています。本チャレンジでは、話者に依存しないトレーニングデータ、開発データ、および限定的なテストデータセットを提供しており、それぞれが本チャレンジで扱われる2つのタスク—カテゴリカルSERタスクおよび属性SERタスク—に対して正確にラベル付けされています。この取り組みは、研究者間の協力を促進し、実世界の状況下でも高精度に動作するSER技術の開発を推進するものであり、最新の音声処理技術を活用した革新的なアプローチの探求を研究者に奨励しています。本論文では、ベースライン手法、リーダーボードの構成、結果の評価方法、および主要な発見について詳細に説明します。コンペティションの公式ウェブサイトには、リーダーボード、ベースラインコードのリンク、および参加手順が掲載されています。詳細は以下をご覧ください:https://lab-msp.com/MSP-Podcast_Competition/leaderboard.php
ベンチマーク
| ベンチマーク | 方法論 | 指標 |
|---|---|---|
| speech-emotion-recognition-on-msp-podcast | wavlm | CCC: 0.6466753 |
| speech-emotion-recognition-on-msp-podcast-1 | wavlm | CCC: 0.7465055 |
| speech-emotion-recognition-on-msp-podcast-2 | wavlm | CCC: 0.6712493 |