DCASE 2013 サウンド イベント検出データセット

DCASE 2013 は、音響シーンおよびイベントの検出と分類の正式名であり、サウンド イベント検出のためのデータ セットです。このデータセットは、音響シーンで顕著な単一サウンド イベントを特徴とする音声のみの録音で構成されています。
シーン分類タスクのデータセットでは、各音場は 30 秒の録音で構成されます。データセットは 2 つの部分で構成され、各部分はシーン (クラス) ごとに 6 つのオーディオ録音で構成されます。シーン リストには、にぎやかな通り、静かな通り、公園、青空市場、バス、地下鉄電車、レストラン、ショップ/スーパーマーケット、オフィス、地下鉄駅の 10 のカテゴリが含まれています。