DCASE 2013 사운드 이벤트 감지 데이터 세트

DCASE 2013은 음향 장면 및 이벤트의 탐지 및 분류를 의미하며, 사운드 이벤트 감지를 위한 데이터 세트입니다. 이 데이터 세트는 음향 장면에서 두드러지는 단일 사운드 이벤트를 특징으로 하는 오디오 전용 녹음으로 구성됩니다.
장면 분류 작업을 위한 데이터 세트에서 각 사운드 장면은 30초 분량의 녹음으로 구성됩니다. 데이터 세트는 2개의 부분으로 구성되며, 각 부분은 장면(클래스)당 6개의 오디오 녹음으로 구성됩니다. 장면 목록에는 10가지 카테고리가 포함됩니다: 번화가, 조용한 거리, 공원, 야외 시장, 버스, 지하철, 레스토랑, 상점/슈퍼마켓, 사무실, 지하철역.