Command Palette

Search for a command to run...

DiaMoE-TTS 多方言音声音声データセット

日付

13時間前

組織

巨大ネットワーク
清華大学

論文URL

2509.22727

ライセンス

CC BY 4.0

Discordコミュニティに参加

DiaMoE-TTSは、清華大学とGiant Interactiveが共同で2025年に公開した、多方言音声合成(TTS)タスク用の音声データセットです。関連する研究論文のタイトルは「…」です。DiaMoE-TTS: 専門家混合とパラメータ効率の高いゼロショット適応を備えた統合IPAベースの方言TTSフレームワーク目標は、複数の方言にわたる転送可能な音声モデリングとゼロショット方言合成研究をサポートする、統一された方言音声表現システムを構築することです。

このデータセットは、複数のオープンソースの方言音声リソースに基づいて構築されており、異なる方言コーパス間で一貫した音韻アノテーションを実現するために、統一された音声表現システムとしてIPA(国際音声記号)を採用しています。音声ソースには、Common Voice広東語データセット、エミリア・マンダリンコーパス、KeSpeechコーパスの方言音声、オープンソースの閩南語(福建語)音声データセットが含まれます。データ処理中、すべての音声サンプルは統一された音素レベルの音声変換を受け、方言間で整合可能なIPAフロントエンドアノテーションシーケンスを構築しました。

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています