HyperAI超神経

ChildMandarin 児童中国語会話音声データセット

日付

2ヶ月前

サイズ

3.4 GB

組織

公開URL

github.com

カテゴリ

ChildMandarinデータセットは、南開大学コンピュータサイエンス学院のAI研究所と人間言語技術研究所(HLTラボ)によって2025年にリリースされた、3歳から5歳までの子供向けの包括的な北京語音声データセットです。このデータセットは、この年齢層の中国語音声データの不足の問題を解決するために設計されています。関連する論文の結果は次のとおりです。ChildMandarin: 3~5歳の幼児向けの包括的な中国語音声データセット「子どもの音声認識や話者照合など、関連する研究分野の発展を支援することを目指しています。」

データセットの機能:

  • 大規模なデータサイズ:397人の子供、3〜5歳児の会話音声合計41.25時間。同様のデータセットの中では一定の利点があります。
  • 広範囲の地理的範囲: 22の省と都市からデータを収集し、地域の多様性を確保し、さまざまなアクセントや話し方の習慣をカバーしています。
  • 自然でリアルなインタラクション:親が主導する対話の収集方法を採用し、自然なコミュニケーションシーンをシミュレートし、音声をよりリアルにします。

ChildMandarin.torrent
シーディング 1ダウンロード中 2ダウンロード完了 23総ダウンロード数 41
  • ChildMandarin/
    • README.md
      1.64 KB
    • README.txt
      3.27 KB
      • data/
        • ChildMandarin.zip
          3.4 GB