18日前

ODAQ: 音声品質のオープンデータセット - GitHubにおけるベンチマーク

{E. A. P. Habets, Wolcott, W., M. M. Halimeh, P. A. Williams, S. Dick, C.-W. Wu, M. Torcoli}
要約

ODAQは、主観的な音質評価スコアが付与された音声信号の公開データセットが不足している問題に応えることを目的としたデータセットである。ODAQには、MUSHRA聴取試験により得られた主観的品質スコアが付与された240件の音声サンプルが含まれている。品質評価済みの音声サンプルは、元の音声素材を処理したバージョンであり、元の音声素材そのものも公開されている。元の音声素材は以下の通りである:44.1 kHzまたは48 kHzのサンプリング周波数を有するステレオ音声;14の音楽エクスカーペ(うち8つはソロ録音);11の映画風サウンドトラックエクスカーペ(会話と音楽、効果音が混在);さらに、各トラックの独立ステム(ステム)および対応する字幕(トランスクリプト)も提供されている。本データセットは、音声品質の客観的評価手法のベンチマークに用いられる。