HyperAIHyperAI

Command Palette

Search for a command to run...

Console

WenetSpeech-Chuan 四川省・重慶省方言音声データセット

日付

5日前

組織

アイシェル
中国電信
ノースウェスタン工科大学

論文URL

2509.18004

ライセンス

Apache 2.0

WenetSpeech-Chuanは、西北工科大学がHillbeak、中国電信人工知能研究所などの機関と共同で2025年に公開した大規模な四川省・重慶方言音声データセットです。関連する研究論文は「WenetSpeech-Chuan: 方言音声処理のための豊富な注釈を備えた大規模四川語コーパス”。

このデータセットには、10,013時間分の四川語と重慶語の方言の音声が含まれており、そのうち3,714時間分は強くラベル付けされたデータ、6,299時間分は弱くラベル付けされたデータです。このデータは9つの実世界のシナリオを網羅しており、短編動画が52,83%を占め、残りはエンターテイメント、ライブストリーミング、オーディオブック、ドキュメンタリー、インタビュー、ニュース、朗読、テレビドラマなどで構成されており、非常に多様でリアルな音声分布を示しています。すべての音声には、テキスト内容、信頼度、音声品質スコア、話者の性別と年齢、感情タグなどの豊富なアノテーション情報が付与されています。

データセットの配布

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています