ChildMandarin 児童中国語会話音声データセット
ChildMandarinデータセットは、南開大学コンピュータサイエンス学院のAI研究所と人間言語技術研究所(HLTラボ)によって2025年にリリースされた、3歳から5歳までの子供向けの包括的な北京語音声データセットです。このデータセットは、この年齢層の中国語音声データの不足の問題を解決するために設計されています。関連する論文の結果は次のとおりです。ChildMandarin: 3~5歳の幼児向けの包括的な中国語音声データセット「子どもの音声認識や話者照合など、関連する研究分野の発展を支援することを目指しています。」
データセットの機能:
- 大規模なデータサイズ:397人の子供、3〜5歳児の会話音声合計41.25時間。同様のデータセットの中では一定の利点があります。
- 広範囲の地理的範囲: 22の省と都市からデータを収集し、地域の多様性を確保し、さまざまなアクセントや話し方の習慣をカバーしています。
- 自然でリアルなインタラクション:親が主導する対話の収集方法を採用し、自然なコミュニケーションシーンをシミュレートし、音声をよりリアルにします。
ChildMandarin.torrent
シーディング 1ダウンロード中 2ダウンロード完了 23総ダウンロード数 41