2ヶ月前

Speechocean762: 非ネイティブ英語話者の発音評価用オープンソース音声コーパス

Junbo Zhang; Zhiwen Zhang; Yongqing Wang; Zhiyong Yan; Qiong Song; Yukai Huang; Ke Li; Daniel Povey; Yujun Wang
Speechocean762: 非ネイティブ英語話者の発音評価用オープンソース音声コーパス
要約

本論文では、発音評価用途のために設計された新しいオープンソースの音声コーパス「Speechocean762」を紹介します。このコーパスは、250人の非ネイティブ話者(その半数が子供)から収集された5000の英語発話を含んでいます。各発話は、文章レベル、単語レベル、音素レベルで5人の専門家によってアノテーションが行われています。また、このコーパスにおける音素レベルの発音評価ワークフローを示すためのベースラインシステムがオープンソースで公開されています。本コーパスは商業目的および非商業目的での自由な利用が許可されており、OpenSLRから無料ダウンロードできます。対応するベースラインシステムはKaldi音声認識ツールキットに公開されています。

Speechocean762: 非ネイティブ英語話者の発音評価用オープンソース音声コーパス | 最新論文 | HyperAI超神経