日付

10ヶ月前

サイズ

1.46 GB

データセット構成

Paper URL

2509.03959

ライセンス

Non-Commercial

タグ

音声および音声処理

音声認識

合成

WenetSpeech Yueは、西北工科大学、中国電信人工知能研究所、北京ヒルシェルテクノロジー株式会社などの機関によって2025年に公開された、広東語の音声認識（ASR）と音声合成（TTS）のための多次元注釈付き大規模音声コーパスです。関連する論文成果は「WenetSpeech-Yue: 多次元アノテーションを備えた大規模広東語音声コーパス」は、広東語分野のリソース不足を補い、質の高い広東語モデルのトレーニングと評価を促進することを目的としています。このデータセットには、ストーリーテリング、エンターテイメント、ドラマ、文化、Vlog、解説、教育、ポッドキャスト、ニュースなど、10の分野を網羅した約21,800時間の広東語録音が含まれています。広東語の自動音声認識（ASR）および音声合成（TTS）モデルの学習と評価、そして実際の言語シナリオにおける多様な分野や話し方の処理に適しています。また、クロスドメイン汎化能力の検証と評価にも役立ちます。

データ構成:

文字起こしテキスト: 自動音声認識の結果。
信頼度スコア: テキストの信頼度や広東語ピンインの信頼度など。
スピーカー属性: 性別、年齢、スピーカー ID。
音声品質指標: SNR や DNSMOS など。
時間注釈: 期間、文字レベルのタイムスタンプ。
拡張メタデータ: プログラム名、領域、リンク、レジスタ情報。

WenetSpeech-Yue.torrent

シーディング 2ダウンロード中 0完了 64総ダウンロード数 238

WenetSpeech-Yue/
- README.md
  2.12 KB
- README.txt
  4.23 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このデータセットを使用

Discordで議論

日付

10ヶ月前

サイズ

1.46 GB

データセット構成

Paper URL

2509.03959

ライセンス

Non-Commercial

タグ

音声および音声処理

音声認識

合成

データ構成:

文字起こしテキスト: 自動音声認識の結果。
信頼度スコア: テキストの信頼度や広東語ピンインの信頼度など。
スピーカー属性: 性別、年齢、スピーカー ID。
音声品質指標: SNR や DNSMOS など。
時間注釈: 期間、文字レベルのタイムスタンプ。
拡張メタデータ: プログラム名、領域、リンク、レジスタ情報。

WenetSpeech-Yue.torrent

シーディング 2ダウンロード中 0完了 64総ダウンロード数 238

WenetSpeech-Yue/
- README.md
  2.12 KB
- README.txt
  4.23 KB

THINGS-EEG EEGデータセット

5ヶ月前

THINGS-MEG磁気脳波データセット

5ヶ月前

THINGS-fMRI機能的磁気共鳴画像データセット

5ヶ月前

Nemotron-Math-v2 数学推論データセット

5ヶ月前

GroundingME 複雑シーン理解評価データセット

6ヶ月前

MCD-rPPGマルチカメラ遠隔光電式容積脈波記録データセット

6ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

データ構成:

AIでAIを構築

HyperAI Newsletters

データ構成:

関連データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

MCD-rPPGマルチカメラ遠隔光電式容積脈波記録データセット

AIでAIを構築

HyperAI Newsletters

データ構成:

関連データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

MCD-rPPGマルチカメラ遠隔光電式容積脈波記録データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

MCD-rPPGマルチカメラ遠隔光電式容積脈波記録データセット

関連データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

MCD-rPPGマルチカメラ遠隔光電式容積脈波記録データセット

Command Palette

WenetSpeech Yue 広東語コーパスデータセット

データ構成:

AIでAIを構築

HyperAI Newsletters

Command Palette

WenetSpeech Yue 広東語コーパスデータセット

データ構成:

関連データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

MCD-rPPGマルチカメラ遠隔光電式容積脈波記録データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

WenetSpeech Yue 広東語コーパスデータセット

データ構成:

関連データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

MCD-rPPGマルチカメラ遠隔光電式容積脈波記録データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

MCD-rPPGマルチカメラ遠隔光電式容積脈波記録データセット

関連データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

MCD-rPPGマルチカメラ遠隔光電式容積脈波記録データセット