Google Audioset 오디오 이벤트 데이터 세트
Google Audioset은 수동으로 주석이 달린 오디오 이벤트의 대규모 데이터 세트로, 오디오 이벤트 감지를 위한 일반적인 실질적 평가 과제를 제공하고 포괄적인 사운드 이벤트 어휘를 위한 시작점을 제공하도록 설계되었습니다.
여기에는 YouTube 동영상에서 추출한 632개의 오디오 분류 샘플과 사람이 레이블을 지정한 2,084,320개의 10초 분량 사운드 클립이 포함되어 있습니다. 이 데이터 세트에는 사람과 동물의 소리, 악기와 장르, 그리고 일상 생활에서 흔히 들리는 주변 환경 소리가 포함됩니다.
이 데이터 세트는 2017년 Google Machine Perception Research에서 공개되었습니다.
관련 논문: 오디오 세트: 오디오 이벤트를 위한 온톨로지 및 인간 레이블이 지정된 데이터 세트