Hill Shell 中国語標準語音声データベース AISHELL-2 の音声時間は 1000 時間で、そのうち 718 時間は AISHELL-ASR0009-[ZH-CN] からのもの、282 時間は AISHELL-ASR0010-[ZH-CN] からのものです。収録テキストは、ウェイクアップワード、音声制御ワード、スマートホーム、無人運転、工業生産など12分野をカバー。録音プロセスは、静かな屋内環境で、高忠実度マイク (44.1kHz、16 ビット)、Android システム携帯電話 (16kHz、16 ビット)、iOS システム携帯電話 (16kHz、16 ビット) の 3 つの異なるデバイスを同時に使用しました。 。 AISHELL-2はiOS携帯電話で録音された音声データを利用します。中国のさまざまなアクセント地域から 1,991 人の話者が録音に参加しました。プロの音声校正者によって書き起こされ、注釈が付けられ、厳格な品質検査に合格した後、このデータベースのテキスト精度は 96% 以上です。 (学術研究を支援するため、無断で商用利用することを禁止します)