Command Palette
Search for a command to run...
DiaMoE-TTS 多方言音声音声データセット
DiaMoE-TTSは、清華大学とGiant Interactiveが共同で2025年に公開した、多方言音声合成(TTS)タスク用の音声データセットです。関連する研究論文のタイトルは「…」です。DiaMoE-TTS: 専門家混合とパラメータ効率の高いゼロショット適応を備えた統合IPAベースの方言TTSフレームワーク目標は、複数の方言にわたる転送可能な音声モデリングとゼロショット方言合成研究をサポートする、統一された方言音声表現システムを構築することです。
このデータセットは、複数のオープンソースの方言音声リソースに基づいて構築されており、異なる方言コーパス間で一貫した音韻アノテーションを実現するために、統一された音声表現システムとしてIPA(国際音声記号)を採用しています。音声ソースには、Common Voice広東語データセット、エミリア・マンダリンコーパス、KeSpeechコーパスの方言音声、オープンソースの閩南語(福建語)音声データセットが含まれます。データ処理中、すべての音声サンプルは統一された音素レベルの音声変換を受け、方言間で整合可能なIPAフロントエンドアノテーションシーケンスを構築しました。