
要約
音声データセットの説明:話された単語を対象としたデータセットで、キーワード検出システムの学習と評価を支援することを目的としています。このタスクが興味深い課題である理由と、完全な文の自動音声認識に使用される従来のデータセットとは異なる専門的なデータセットが必要な理由について議論します。このタスクに対する再現可能かつ比較可能な精度指標のための方法論を提案します。データ収集と検証の方法、データセットの内容、過去のバージョンおよび特性について説明します。最後に、このデータセットで学習したモデルの基準結果を報告します。