Google Audioset オーディオ イベント データ セット
Google Audioset は、手動で注釈が付けられたオーディオ イベントの大規模なデータセットであり、オーディオ イベント検出のための一般的な実用的な評価タスクを提供するとともに、包括的なサウンド イベント語彙の開始点を提供するように設計されています。
このデータセットには、632 の音声分類サンプルが含まれており、YouTube ビデオから人間がタグ付けされた 2,084,320 個の 10 秒サウンド クリップが抽出されています。このデータセットには、人間や動物の鳴き声、楽器やジャンル、および日常の一般的な環境音が含まれています。
このデータセットは、2017 年に Google Machine Perception Research によってリリースされました。
関連文書: 「オーディオ セット: オーディオ イベント用のオントロジーと人間がラベル付けしたデータセット」